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(57) Abstract 

The invention relates to a gene construct containing a biotin gene with the sequence SEQ ID No. 1 or SEQ ID No. 3, and to organisms 
containing said gene construct, the use of these sequences or the gene construct for producing biotin and to a method for producing biotin. 

(57) Zusammenfassung 

Die Erfindung betrifft ein Genkonstrukt enthaltend ein Biotingen mit der Sequenz SEQ ID No. 1 oder SEQ ID No. 3, Organismen, die 
dieses Genkonstrukt enthalten, die Verwendung dieser Sequenzen oder des Genkonstrukts zur Herstellung von Biotin, sowie ein Verfahren 
zur Herstellung von Biotin. 
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Verfahren zur Herstellung von Biotin 
Beschre ibung 

5 

Die Erfindung betrifft ein Genkonstrukt enthaltend ein Biotingen 
mit der Sequenz SEQ ID No. 1 Oder SEQ ID No. 3, Organismen, die 
dieses Genkonstrukt enthalten, die Verwendung dieser Sequenzen 
Oder des Genkonstrukts zur Herstellung von Biotin, sowie ein 
10 Verfahren zur Herstellung von Biotin . 

Als coenzym spielt Biotin (Vitamin H) eine essentielle Rolle bei 
enzymkatalysierten Carboxylierungs- und Decarboxylierungsreaktio- 
nen. Biotin ist damit ein essentieller Faktor in lebenden Zellen. 
15 Biotin muB von fast alien Tieren und einigen Mikroorganismen von 
aufien aufgenommen werden, da sie Biotin nicht selber synthetisie- 
ren konnen. Es ist damit fur diese Organismen ein essentielles 
Vitamin. Bakterien, Hefen und Pflanzen hingegen konnen Biotin aus 
Vorstufen selbst synthetisieren (Brown et al. Biotechnol. Genet. 
Eng. Rev. 9, 1991: 295 - 326, DeMoll, E . , Escherichia coli and 
Salmonella, eds . Neidhardt, F. C. et al. ASM Press, Washington 
DC, USA, 1996: 704 - 708, ISBN 1-55581-084-5). 



20 



Die Biotinsynthese wurde in bakteriellen Organismen speziell im 
gramnegativen Bakteriurn Escherichia coli und im gramposi tiven 

25 Bakteriurn Bacillus sphaericus untersucht (Brown et al. Bio- 
technol. Genet. Eng. Rev. 9, 1991: 295 - 326). Als erstes bis- 
her bekanntes Intermediat in E. coli wird Pimelyl-CoA (PmCoA) 
angesehen, das aus der Fettsauresynthese stammt (DeMoll, E . , 
Escherichia coli and Salmonella, eds. Neidhardt, F. C. et al. ASM 

30 Press, Washington DC, USA, 1996: 704 - 708, ISBN 1-55581-084-5 
1996) . Der Syntheseweg dieser Biotin-Vorstuf e in E. coli ist 
bisher weitgehend unbekannt (Ifuku 1993, Lemoine 1996). Es wurden 
mit bioC und bioH zwei Gene identif iziert , deren korrespondie- 
rende Proteine fur die Synthese von Pm-CoA verantwortlich sind. 

35 Die enzymatische Funktion der Genprodukte BioH und BioC ist 
bisher nicht bekannt (Lemoine et al., Mol. Microbio. 19, 1996: 
645 - 647, DeMoll, E., Escherichia coli and Salmonella, eds. 
Neidhardt, F. C. et al . ASM Press, Washington DC, USA, 1996: 704 
- 708, ISBN 1-55581-084-5) . Pm-CoA wird in vier weiteren enzy- 

40 matischen Schritten zum Biotin umgewandelt. Ausgehend vom Pm-CoA 

findet zuerst die^Kondensation mit Alanin zu_ Amino- 

Pelargonsaure (KAPA) statt. Das Genprodukt fur diese Umsetzung 
ist BioF (KAPA-Synthetase) . KAPA wird mit dem Kosubstrat S-Adeno- 
syl-Methionin durch BioA (DAPA-Aminotransf erase) zu 7,8 Diamino- 

45 Pelargonsaure transaminiert . Der nachste Schritt fuhrt nach einer 
ATP-abhangigen Carboxy lierungsreaktion zum Dethiobiotin (DTB) und 
wird durch BioD (Dethiobiotin- Synthase ) katalysiert. Im letzten 
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Schritt findet die Umsetzung von DTB zu Biotin statt. Dieser 
Schritt wird durch BioB (Biotin-Synthetase) katalysiert. Die fur 
die beschriebenen Proteine kodierenden Gene bioF, bioA, bioD, und 
bioB sind in E. coli auf einem bidirekt ionalem Operon kodiert. 
5 Dieses Operon liegt zwischen der A,-attachment-si te und dem uvrB 
Gen Locus bei ca. 17 Minuten auf dem E. coli Chromosom (Berlyn et 
al . 1996: 1715 - 1902). Auf diesem Operon sind zusatzlich noch 
zwei weitere Gene kodiert, von denen das eine, bioC, bereits 
beschriebene Funktionen in der Syn these von Pm-CoA hat, wahrend 

!0 einem offenen Leseraster hinter bioA bisher keine Funktion zuge- 
ordnet werden konnte (WO94/8023, Otsuka et al., J. Biol. Chern. 
263, 1988: 19577 - 85). Hoch konservierte Homologe zu den E. coli 
Proteinen BioF, A, D, B wurden in B. sphaericus, B. subtilis, 
Syneccocystis sp. (Brown et al. Biotechnol. Genet. Eng. Rev. 9, 

15 1991: 295 - 326, Bower et al . , J. Bacteriol. 175, 1996: 4122 - 
4130, Kaneko et al., DNA Res. 3, 3, 1996: 109 - 136), Archae- 
bakterien wie Methanococcus janaschi, Hefen wie Saccharomyces 
cerevisiae (Zhang et al., Arch. Biochem. Biophys. 309, 1, 1994: 
29 - 35) oder in Pflanzen wie Arabidopsis thaliana (Baldet et 

2Q al., C. R. Acad. Sci . Ill, Sci. Vie. 319, 2, 1996: 99 - 106)) 
gef unden. 

Die Synthese von Pm-CoA scheint in den beiden bisher unter - 
suchten gram-positiven Mikroorganismen anders zu verlaufen als 
in E. coli. Es konnten keine Homologen von bioH und bioC ge- 
25 f unden werden (Brown et al. Biotechnol. Genet. Eng. Rev. 9, 1991: 
295 - 326) . 

Biotin ist eine optisch aktive Substanz mit drei Chiralitats- 
zentren. Es wird bisher wirtschaf tlich nur iiber eine vielstufige, 
30 teure chemische Synthese hergestellt werden. 

Alternativ zu dieser chemischen Synthese wurde eine Vielzahl 
von Versuchen unternommen, ein f ermentatives Verfahren zur Her- 
stellung von Biotin mit Mikroorganismen aufzubauen. Durch Klonie- 

35 rung des Biotin-Operons auf mul ti-copy-Plasmide konnte die Bio- 
tinsyn these in den mit diesen Genen transf ormierten Mikroorganis- 
men erhoht werden. Eine weitere Erhohung der Biotinsynthese wurde 
durch die Deregulierung der Biotingenexpression iiber die Selek- 
tion von birA-Mu tanten erreicht (Pai C. H. , J. Bacteriol. 112, 

40 1972: 1280 - 1287). Die {Combination beider Ansatze, das heifit die 
Expression der Plasmid-kodierten Biosynthesegene in einem regula- 
tionsdef izienten Stamm (EP-B-0 236 429), brachte eine weitere 
Steigerung der Produktivita t . Das Biot in-Operon kann dabei ent- 
weder unter Kontrolle seines nativen bidirektionalem Promotors 

45 verbleiben (EP-B-0 236 429), oder seine Gene konnen unter die 
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Kontrolle eines extern regulierbaren Promotors gebracht werden 
(WO94/8023) . 

Durch die bisher verfolgten Ansatze zur f ertnentativen Herstellung 
5 von Biotin in E. coli konnte keine wirtschaf tlich ausreichende 
Produktivitat erreicht werden. Es zeigte sich, daB die Ausbeute 
in der f ermentativen Herstellung von Biotin durch die unvoll- 
standige Umwandlung von DTB zu Biotin durch das BioB-Genprodukt 
(Biotinsynthase) verursacht wird. Zellen die Mutationen im bioB- 
10 Gen tragen, sind nicht in der Lage auf DTB zu wachsen und damit 
DTB in Biotin umzuwandeln . Der chemische und enzymatische Mecha- 
nismus der Umwandlung von DTB zu Biotin ist bisher nur unvoll- 
standig verstanden und aufgeklart. 



15 
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Durch intensive genetische Untersuchungen konnten bisher keine 
weiteren an der Reaktion beteiligten Proteine identif iziert 
werden. Eine Charakterisierung der Umwandlung von DTB zu Biotin 
wurde bisher ausschlieSlich in bakteriellen bzw. pflanzlichen 
Zellextrakten durchgefiihrt (WO94/8023, EP-B-0 449 724, Sanyal 
et al. Arch. Biochem. Biophys., Vol. 326, No. 1, 1996: 48 - 56 
und Biochemistry 33, 1994: 3625 - 3631, Baldet et al. Europ. J. 
Biochem. 217, 1, 1993: 479 - 485, Mejean et al . Biochem. Biophys. 
Res. Commun., Vol. 217, No. 3, 1995: 1231 - 1237, Ohshiro et al., 
Biosci. Biotechnol. Biochem., 58, 9, 1994: 1738 - 1741). 

25 Diese Untersuchungen haben gezeigt, daB niedermolekulare Faktoren 
wie S-Adenosylmethionin, NADPH, Cystein, Thiamin, Fe2 + , Asparagin, 
Serin, Fruktose 1-6-bisphosphat die Synthese von Biotin stimulie- 
ren (Ohshiro et al., Biosci. Biotechnol. Biochem., 58, 9, 1994: 
1738 - 1741, Birch et al., J. Biol. Chem. 270, 32, 1995: 19158 - 

30 19165, Ifuk et al., Biosci. Biotechnol. Biochem., 59, 2, 1995: 
185 - 189). Neben diesen niedermolekularen Faktoren wurden 
weitere Proteine identif iziert, die die Synthese von Biotin aus 
DTB in Gegenwa-rt -von BioB stimulieren. Dabei handelt es sich ura 
Flavodoxin und Flavodoxin-NADPH-Reduktase (Birch et al., J. Biol. 

35 Chem. 270, 32, 1995: 19158 - 19165, Ifuk et al . , Biosci. Bio- 
technol. Biochem., 59, 2, 1995: 185 - 189, Sanyal et al . , Arch. 
Biochem. Biophys. 326, 1, 1996: 48 - 56). 



40 



Die Biotin- und Liponsauresynthese weisen eine groBe Homologie 
auf. In beiden Synthesewegen wird auf der letzten Synthesestuf e 
~z^ischen~mch-e-ak^ 



felatome inseriert. Die Synthese von Liponsaure ist bisher nur 
unzureichend charakterisiert (DeMoll, E . , Escherichia coli and 
Salmonella, eds . Neidhardt, F. C. et al. ASM Press, Washington 
45 DC, USA, 1996: 704 - 708, ISBN 1-55581-084-5). Es wurden bisher 
nur zwei notwendige Gene in E. coli identif iziert : lipA und lipB. 
Beide Gene liegen in einem Operon, mit einem bisher nicht charak- 
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terisiertem Open Reading Frame (= ORF) zwischen beiden Genen. Ein 
weiters Gen lplA ist in der Lage Liponsaure uber ein Lipoyl-AMP- 
Intermediat auf Lysin zu ubertragen. Diese Reaktion hat somit 
Ahnlichkeit mit der Aktivitat von birA. Zwischen LipA und BioB 
konnten durch Sequenzvergleiche homologe Bereiche in der Amino - 
sauresequenz identif iziert werden. Diese Umfassen unter anderem 
ein Cystein-Cluster . Es konnte gezeigt werden, daB LipA fur den 
Einbau von zwei Schwef elatomen in die Liponsaure katalysiert 
(DeMoll, E., Escherichia coli and Salmonella, eds. Neidhardt, 
F . C. et al. ASM Press, Washington DC, USA, 1996: 704 - 708, ISBN 
1-55581-084-5) . 

Uber die Herkunft des Schwefels im Biotinmolekul existieren 
widerspruchliche Ergebnisse. Bei Untersuchungen der Biotinsynt- 
hese in Gesamtzellextrakten wurde gezeigt, daB in Gegenwart von 
35 S-markier tern Cystein Radioaktivi tat in Biotin inkorporiert 
wurde; weder mit 35 S-markiertem Methionin noch mit S-Adenosyl- 
Methionin konnte ein Schwef el-Einbau ins Biotinmolekul nachge- 
wiesen werden (Ifuku et al-, Biosci. Biotechnol. Biochem. 59, 2, 
1995: 184 - 189, Birch et al . , J. Biol. Chem.270, 32, 1995: 19158 
- 19165) . 

Im Gegensatz dazu stehen Untersuchungen mit gereinigtem BioB- 
Protein in Gegenwart von 35 S-markiertem Cystein und ohne Zugabe 
von Zellextrakten, bei denen zwar eine Biotin-Synthese aber kein 
Einbau von Radioaktivitat in das Biotinmolekul beobachtet werden 
konnte (Sanyal et al . , Arch. Biochem. Biophys. 326, 1, 1996: 
48-56, Mejean et al., Biochem. Biophys. Res. Commun. 2127, 3, 
1995: 1231 - 1237). Unter diesen Synthesebedingungen ohne Zell- 
extraktzugabe war die gebildete Biotinmenge niedrig und entsprach 
maximal ca. 2 Mol Biotin/Mol BioB (Sanyal et al., Arch. Biochem. 
Biophys. 326, 1, 1996: 48 - 56) bzw. 0,1 Mol Biotin/Mol BioB 
(Mejean et al., Biochem. Biophys. Res. Commun. 2127, 3, 1995: 
1231 - 1237). Nach diesen Untersuchungen kann ein Einbau von 
Schwef el in Biotin erfolgen, ohne das Cystein als Schwef eldonor 
verwendet wird. Diese Biotinbildung ohne externe S-Quelle konnte 
durch eine Ubertragung von Schwef el aus dem in BioB nachge- 
wiesenen 2Fe-2S Cluster erklart werden. Die tatsachliche 
Schwef elquelle fur die Biotinsynthese ist nach wie vor unklar. 
Damit konnte bisher in vitro keine echte katalytische Aktivitat 
von BioB nachgewiesen werden. 

Trotz dieser Vielzahl von Ansatzen reicht die Ausbeute an Biotin 
durch mikrobielle Fermentation bisher fur eine industrielle 
Produktion nicht aus. 
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Aufgabe der vorliegenden Erfindung war es, ein technisches, 
fermentatives Verfahren zur Herstellung von Biotin zu entwickeln, 
daS eine moglichst optimale Umwandlung von Dethiobiotin in Biotin 
aufweist und damit eine verbesserte Biotinsynthese ermdglicht. 

5 Diese Aufgabe wurde durch das erf indungsgemaBe Verfahren zur Her- 
stellung von Biotin, dadurch gekennzeichnet , daB man ein Biotin- 
gen mit der Sequenz SEQ ID No. 1 oder SEQ ID No. 3 sowie seine 
funktionellen Varianten, Analoge oder Derivate in einem proka- 
10 ryontischen oder eukaryontischen Wir tsorganismus , der in der Lage 
ist Biotin zu synthetisieren, exprimiert , diesen zuchtet und das 
synthetisierte Biotin direkt, nach Abtrennung der Biomasse oder 
nach Reinigung des Biotins verwendet, geldst. 

Die im erf indungsgemaBen Verfahren verwendeten Biotingene mit den 
Sequenzen SEQ ID No . 1 bzw. SEQ ID No. 3 werden in der SwissProt- 
Datenbank unter den "Accession" -Nummern AE000364 und D90811 
gefuhrt. Die Sequenz D90811 wird auBerdem von Aiba et al. in DNA 
Res. 3, 6, 1996: 363 - 377 beschrieben. Bei beiden Sequenzen 
wird in der Datenbank eine Homologie zum NifS-Protein vermerkt. 
20 Weitere Inf ormationen zu diesen Sequenzen sind der Datenbank bzw. 
der Publikation nicht zu entnehmen. 

Durch Expression der Sequenzen SEQ ID No. 1 und/oder SEQ ID No. 3 
in einem prokaryontischen oder eukaryontischen wirtsorganismus 
25 laflt sich die Produktivi tat der Biotinbiosynthese deutlich 

steigern. Durch die Expression der Gene wird die Synthese von 
Biotin aus Dethiobiotin urn mindestens den Faktor 2 gegenuber der 
Kontrolle ohne diese Gene, bevorzugt urn einen Faktor groBer 3, 
gesteigert. Bevorzugt wird die Sequenz SEQ ID No. 1 verwendet. 



30 



Nach Isolierung und Sequenzierung sind die im erf indungsgemaBen 
Verfahren verwendeten Biotingene mit den Nukleotidsequenzen SEQ 
ID" No. r und- SEQ ID No. 3 erhSltlich., die fur _die in SEQ ID NO: 2 
und SEQ ID No. 4 angegebenen Aminosauresequenzen oder deren 
35 Allelvariationen kodieren. Unter Allelvarianten sind SEQ ID 

No. 1- oder SEQ ID No. 3-Varianten zu verstehen, die 40 bis 100 % 
Homologie auf Aminosaureebene , bevorzugt SO bis 100 %, ganz be- 
sonders bevorzugt 80 bis 100 % aufweisen. Allelvarianten umfassen 
insbesondere funktionelle Varianten, die durch Deletion, Inser- 
ti on oder Substitution von Nukleotiden aus der in SEQ ID NO: 1 

oder SEQ ~1D NO:~ 3 darges tell ten Sequenz^-rhaltTi-ch-si-ndT--wobei 

die enzymatische Aktivitat aber erhalten bleibt. 



40 
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Unter Analoge von SEQ ID NO: 1 oder SEQ ID NO: 3 sind beispiels- 
weise ihre bakteriellen, pilzlichen, pflanzlichen Oder Hefe- 
Homologen, verkurzte Sequenzen, Einzelstrang-DNA Oder RNA der 
codierenden und nichtcodierenden DNA-Sequenz zu verstehen. 

5 

Derivate sind beispielsweise Promotorvarianten zu verstehen. Die 
Promotoren, die den angegebenen Nukleotidsequenzen vorgeschalten 
sind, konnen durch ein Oder mehrere Nukleotidaus tausche, durch 
Insertion (en) und/oder Deletion (en) verandert sein, ohne daB aber 
10 die Funktionalitat bzw. Wirksamkeit der Promotoren beeintrachtigt 
sind. Des weiteren konnen die Promotoren durch Veranderung ihrer 
Sequenz in ihrer Wirksamkeit erhoht oder komplett durch wirk- 
samere Promotoren auch artfremder Organismen ausgetauscht werden. 

15 Unter Derivaten sind auch Varianten zu verstehen, deren Nukleo- 
tidsequenz im Bereich von -1 bis -30 vor dem Startkodon so 
verandert wurden, daB die Genexpression und/oder die Protei- 
nexpression erhoht wird . Vor teilhaf terweise geschieht dies durch 
eine veranderte Shine-Dalgarno-Sequenz . 

20 

Als prokaryontische Wir tsorganismen des erf indungsgemafien Ver- 
fahrens kommen prinzipiell alle Biotin synthetisierenden gram- 
negativen oder gram-positiven Bakterien in Frage. Als gram- 
negative Bakterien seien beispielhaft Enterobacter iaceae wie die 

25 Gattungen Escherichia, Aerobacter, Enterobacter, Citrobacter, 

Shigella, Klebsiella, Serratia, Erwinia oder Salmonella, Pseudo- 
monadaceae wie die Gattungen Pseudomonas, Xanthomonas, Burkhol- 
deria, Gluconobacter , Nitrosomonas, Nitrobacter, Methanomonas, 
Comamonas, Cellulomonas oder Acetobacter, Azotobac teraceae wie 

30 die Gattungen Azotobacter, Azomonas, Beijerinckia oder Derxia, 
Neisseriaceae wie die Gattungen Moraxella, Acinetobacter , 
Kingella, Neisseria oder Branhamella, die Rhizobiaceae wie die 
Gattungen Rhizobium oder Agrobacterium oder die gram-negativen 
Gattungen Zymomonas, Chromobacterium oder Flavobacterium, 

35 genannt. Als gram-positive Bakterien seien beispielhaft die 
Endosporen-bildenden gram-positiven aeroben oder anaeroben 
Bakterien wie die Gattungen Bacillus, Sporolactobacillus oder 
Clostridium, die coryneformen Bakterien wie die Gattungen 
Ar throbacter , Cellulomonas , Curtobacterium, Corynebacter ium, 
Brevibacterium, Microbac ter ium oder Kurthia, die Act inomycetales 

4 0 

wie die Gattungen Mycobacterium, Rhodococcus, Streptomyces oder 
Nocardia, die Lactobacillaceae wie die Gattungen Lactobacillus 
oder Lactococcus, die gram-positiven Kokken wie die Gattungen 
Micrococcus Oder Staphylococcus, genannt. 

45 Bevorzugt werden Bakterien der Gattungen Escherichia, Citro- 
bacter, Serratia, Klebsiella, Salmonella, Pseudomonas, Comamonas, 
Acinetobacter, Azotobacter, Chromobacterium, Bacillus, Clos* 
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tridium, Arthrobacter , Corynebacterium, Brevibacterium, Lactococ- 
cus, Lactobacillus, Streptomyces, Rhizobium, Agrobacterium Oder 
Staphylococcus im erf indungsgemaBen Verfahren verwendet. Beson- 
ders bevorzugt werden Gattungen und Arten wie Escherichia coli, 
5 Citrobacter freundii, Serratia marcescens. Salmonella typhimu- 
rium, Pseudomonas mendocina, Pseudomonas aeruginosa, Pseudomonas 
mutabilis, Pseudomonas chlororaphis, Pseudomonas fluorescens, 
Comamonas acidovorans, Comamonas testosteroni , Acinetobacter 
calcoaceticus, Azotobacter vinelandii. chromobacterium violaceum, 

10 Bacillus subtilis. Bacillus sphaericus, Bacillus stearother- 
mophilus, Bacillus pumilus, Bacillus lichenif ormis , Bacillus 
amyloliquefaciens. Bacillus megaterium. Bacillus cereus, Bacillus 
thuringiensis. Arthrobacter citreus, Arthrobacter paraffineus, 
Corynebacterium glutamicum, Corynebacterium primorioxydans , 

, 5 - Corynebacterium sp. , Brevibacterium ketoglutamicum, Brevibacte- 
rium linens, Brevibacterium sp. , Streptomyces lividans, Rhizobium 
leguminosarum oder Agrobacterium tumef aciens. Vorteilhaf terweise 
werden Bakterien verwendet, die schon eine erhohte naturliche 
Biotinproduktion besitzen. 

20 Die taxonomische Stellung der aufgefuhrten Gattungen unterlag in 
den letzten Jahren einem starken wandel und befindet sich noch 
immer im FluS, da falsche Gattungs- und Artnamen korrigiert wer- 
den. Aufgrund dieser in der Vergangenheit haufig erf orderlichen 
taxonomischen Umgruppierungen der genannten Gattungen innerhalb 

25 der bakteriellen Systematik sind auch andere als die oben genann- 
ten Familien, Gattungen und Arten fur das erf indungsgemaBe Ver- 
fahren geeignet. 

Als eukaryontische Wirtsorganismen des erf indungsgemaBen verfah- 
30 rens kommen prinzipiell alle Biotin synthetisierenden Organismen 
in Frage wie Pilze, Hefen, Pflanzen Oder pflanzliche Zellen. Als 
Hefen seien die Gattungen Rhodotorula, Yarrowia, Sporobolomyces, 
Saccharomyces oder Schizosaccharomyces bevorzugt genannt . Beson- 
ders bevorzugt sind die Gattungen und Arten Rhodotorula rubra. 
35 Rhodotorula glutinis, Rhodotorula graminis, Yarrowia lipolytica, 
Sporobolomyces salmonicolor , Sporobolomyces shibatanus oder 
Saccharomyces cerevisiae. 

Als Wirtsorganismus konnen prinzipiell alle Pflanzen verwendet 
40 werden, bevorzugt werden Pflanzen, die in der Tierernahrung oder 

in "der humanen Ernahrung eine Rolle spielen wie Mais, Weizen, 

Gerste, Roggen, Kartoffeln, Erbsen, Bohnen, Sonnenblumen, Palmen, 
Hirse, Sesam, Kopra oder Raps. Auch Pflanzen wie Arabidopsis 
thaliana oder Lavendula vera sind geeignet. Besonders bevorzugt 
45 werden pflanzliche Zellkul turen, Protoplasten aus Pflanzen oder 
Kaluskul turen . 
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Vorteilhaf terweise werden im erf indungsgemaBen Verfahren Mikroor - 
ganismen wie Bakterien, Pilze, Hefen Oder pflanzliche Zellen ver- 
wendet, die in der Lage sind Biotin in das Anzuchtsmedium aus- 
zuscheiden und die gegebenenf alls zusatzlich schon eine erhohte 
naturliche Biotinsynthese haben. Vorteilhaf terweise konnen diese 
Organismen noch bezuglich der Regulation ihrer Biotinbiosynthese 
defekt sein, das heiBt es findet keine Oder nur eine sehr verrin- 
gerte Regulation der Synthese statt. Dieser Regulationsdef ekt hat 
zur Folge, daB diese Organismen schon eine wesentlich hohere 
Biotinproduktivitat besitzen. Ein solcher Regulationsdef ekt ist 
beispielsweise von Escherichia coli als birA-Def ektmutanten 
bekannt und sollte vorzugsweise in Form eines durch auBere 
Einfliisse induzierbaren Defektes, beispielsweise temperatu- 
rinduzierbar , in den Zellen vorhanden sein. Es konnen im Prinzip 
auch Organismen verwendet werden, die keine naturliche Biotin- 
produktion aufweisen, nachdem sie mit den Biotingenen transfor- 
miert wurden. 

Um die Biotinproduktivitat insgesamt weiter zu steigern sollten 
die Organismen im erf indungsgemaBen Verfahren vorteilhaf terweise 
zusatzlich mindesten ein weiteres Biotingen ausgewahlt aus der 
Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY 
Oder bioR enthalten. Dieses zusatzliche Gen oder diese zusatz- 
lichen Gene konnen in ein oder mehreren Kopien in der Zelle vor- 
handen sein. Sie konnen auf dem gleichen Vektor wie die Sequenzen 
SEQ ID No. 1 und/oder SEQ ID No . 3 lokalisiert sein oder auf 
getrennten Vektoren oder aber chromosomal integriert worden sein. 
Auch die Sequenzen SEQ ID No. 1 und/oder SEQ ID No . 3 konnen ins 
Genom inseriert werden. 

Unter dem erf indungsgemaBen Genkonstrukt sind die Biotingense- 
quenzen SEQ ID No, 1 und SEQ ID No. 3 sowie deren funktionelle 
Varianten, Analoge oder Derivate zu verstehen, die mit einem oder 
mehreren Regulationssignalen zur Erhdhung der Genexpression funk- 
tionell verknupft wurden. Zusatzlich zu diesen neuen Regula- 
tionssequenzen kann die naturliche Regulation dieser Sequenzen 
vor den eigentlichen Strukturgenen noch vorhanden sein und ge- 
gebenenf alls genetisch verandert worden sein, so daB die natur- 
liche Regulation ausgeschal te t und die Expression der Gene erhoht 
wurde. Das Genkonstrukt kann aber auch einfacher aufgebaut sein, 
das heiBt es wurden keine zusatzlichen Regulationssignale vor die 
Sequenzen SEQ ID No. 1 und/oder SEQ ID No. 3 inseriert und der 
naturliche Promotor mit seiner Regulation wurde nicht entfernt. 
Stattdessen wurde die naturliche Regulat ionssequenz so mutiert, 
daB keine Regulation durch Biotin mehr erfolgt und die Ge- 
nexpression gesteigert wird. Auch am 3'-Ende der DNA-Sequenzen 
konnen zusatzliche vorteilhaf te regulatorische Elemente inseriert 
werden. Die Biotingene mit den Sequenzen SEQ ID No, 1 und/oder 
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SEQ ID No. 3 konnen in einer oder mehreren Kopien im Genkonstrukt 
enthalten sein. 

Vorteilhafte Regulationssequenzen fur das erf indungsgemaSe Ver- 
5 fahren sind beispielsweise in Promotoren wie cos-, tac- , trp-, 
tet-, trp-tet-, lpp-. lac-, lpp-lac-, lad*-- T7-, T5-. T3-. 
gal-, trc-, ara-, SP6-, X-Pr- oder im *.-P L - Promo tor enthalten, die 
vorteilhaf terweise in gram-negativen Bakterien Anwendung finden. 
Weitere vorteilhafte Regulationssequenzen sind beispielsweise in 
10 den gram-positiven Promotoren amy und SP02, in den Hef epromotoren 
ADC1, MFa , AC, P-60, CYC1 . GAPDH oder in den Pf lanzenpromotoren 
CaMV/35S, SSU, OCS, lib4 , usp, STLS1 , B33, nos oder im Ubiquitin- 
oder Phased in- Promotor enthalten. 



15 



20 



25 



Prinzipiell konnen alle naturlichen Promotoren mit ihren Regula- 
tionssequenzen wie die oben genannten fur das erf indungsgemaBe 
Verfahren verwendet werden. Daruberhinaus konnen auch synthe- 
tische Promotoren vorteilhaft verwendet werden. 

im Genkonstrukt konnen weitere Biotingene ausgewahlt aus der 
Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY 
oder bioR in einer oder mehreren Kopien enthalten sein, die einen 
eigenen Promotor haben konnen oder aber unter der Regulation des 
Promotors der Sequenzen SEQ ID No . 1 oder SEQ ID No. 3 liegen 
konnen . 



30 



Das Genkonstrukt wird zur Expression in den oben genannten Wirts- 
organismus vorteilhaf terweise in einen wirtsspezif ischen Vektor 
inseriert, der eine optimale Expression der Gene im Wirt ermog- 
licht. Geeignete Vektoren sind beispielsweise in E. coli pLG338, 
PACYC184, pBR322, pUC18, pUC19, pKC30, pRep4 , pHSl, pHS2 , 
pPLc23 6 , PMBL24, pLG200, pUR290, pIN-III 113 -Bl , Xgtll oder pBdCI, 
in Streptomyces pIJlOl, pIJ364, pIJ702 oder plJ361. in Bacillus 
pUBl-10, pC194 oder pBD214, in Corynebacterium pSA77 oder PAJ667, 
in Pilzen pALSl, pIL2 Oder pBB116, in Hef en YEp6, YEpl3 oder pEM- 
35 BLYe23 oder in Pflanzen pLGV23, pGHlac + , pBIN19, pAK2004 Oder 
PDH51. Die genannten Vektoren stellen eine kleine Auswahl der 
moglichen Vektoren dar. Weitere Vektoren sind dem Fachmann wohl 
bekannt und konnen beispielsweise aus dem Buch Cloning Vectors 
(Eds. Pouwels P. H. et al. Elsevier, Amsterdam-New York-Oxford, 
40 1985 , ISBN 0 444 904018) entnommen werden. 



Unter Expressionssysteme sind die Kombination aus den oben bei- 
spielhaft genannten Wirtsorganismen und den zu den Organismen 
passenden Vektoren wie Plasmide, Viren Oder Phagen wie das T7 RNA 
45 Polymerase/Promoter System oder Vektoren mit regulator ischen 
Sequenzen fur den Phagen k zu verstehen. 
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Bevorzugt sind unter dem Begriff Expressionssysteme die Kombina- 
tion aus Escherichia coli und seinen Plasmiden und Phagen und den 
dazugehorenden Promotoren sowie Bacillus und seine Plasmide und 
Promotoren zu verstehen. 

5 

Fur die vorteilhafte erf indungsgemaBe Expression der SEQ ID No. 1 
und SEQ ID No. 3 sind aufierdem weitere 3' und/oder 5' Terminale 
regula torische Sequenzen geeignet. 

10 Diese regulatorischen Sequenzen sollen die gezielte Expression 
der Biotingene und der Proteinexpression ermoglichen . Dies kann 
beispielsweise je nach Wirtsorganismus bedeuten, daB das Gen erst 
nach Induction exprimiert Oder iiberexprimier t wird, Oder daB es 
sofort exprimiert und/oder uberexprimiert wird. 

15 

Die regulatorischen Sequenzen bzw. Faktoren konnen dabei vorzugs- 
weise die Biotingenexpression positiv beeinflussen und dadurch 
erhohen. So kann eine Verstarkung der regulatorischen Elemente 
vorteilhaf terweise auf der Transkriptionsebene erfolgen, indem 
20 starke Transkriptionssignale wie Promotoren und/oder "Enhancer" 
verwendet werden. Daneben ist aber auch eine Verstarkung der 
Translation moglich, indem beispielsweise die Stabilitat der mRNA 
verbessert wird. 

25 Unter "Enhancer" sind beispielsweise DNA-Sequenzen zu verstehen, 
die iiber eine verbesserte wechselwirkung zwischen RNA- Polymerase 
und DNA eine erhohte Biotingenexpression bewirken. 

Eine Steigerung der von den Sequenzen SEQ ID No. 1 oder SEQ ID 
30 No. 3 abgeleiteten Proteinen und ihrer Enzymaktivitat laBt sich 
zum Beispiel gegenuber den Ausgangsenzymen durch Veranderung der 
entsprechenden Gensequenzen oder der Sequenzen seiner Homologen 
durch klassische Mutagenese wie UV-Bestrahlung oder Behandlung 
mit chemischen Mutagentien und/oder durch gezielte Mutagenese wie 
35 site directed mutagenesis, Dele tion (en) , Insertion (en) und/oder 
Substitution (en) erzielen. Auch kann eine erhohte Enzymaktivitat 
neben der beschriebenen Genamplif ika tion durch Ausschaltung von 
Faktoren, die die Enzymbiosynthese reprimieren und/oder durch 
Synthese aktiver statt inaktiver Enzyme erreicht werden. 

40 

Durch das erf indungsgemaBe Verfahren wird die Umwandlung von DTB 
in Biotin und damit die Bio tinproduktivi tat insgesamt iiber die in 
die Organismen uber Vektoren und/oder chromosomal klonierten Bio- 
tingene mit den Sequenzen SEQ ID No. 1 oder SEQ ID No. 3 vorteil- 
45 haft gesteigert. 
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Im erf indungsgemaBen Verfahren werden die SEQ ID No. 1 und/oder 
SEQ ID No. 3 enthaltenen Mikroorganisrnen in einem Medium, das das 
Wachstum dieser Organismen ermoglicht angezuchtet. Dieses Medium 
kann ein synthetisches oder ein naturliches Medium sein. Je nach 
Organismus werden dem Fachmann bekannte Medien verwendet. Fur das 
Wachstum der Mikroorganisrnen enthalten die verwendeten Medien 
eine Kohlenstoff quelle , eine Stickstoff quelle, anorganische Salze 
und gegebenenf alls geringe Mengen an Vitamine und Spurenelemente . 

Vorteilhaf te Kohlenstoff quellen sind beispielsweise Zucker wie 
Mono-, Di- oder Polysaccharide wie Glucose, Fructose, Mannose, 
Xylose, Galactose, Ribose, Sorbose, Ribulose, Lactose, Maltose, 
-Saccharose, Raffinose, Starke oder Cellulose, komplexe Zucker - 
quellen wie Melasse, Zuckerphosphate wie Fructose-1 , 6-bis - 
phosphat, Zuckeralkohole wie Mannit, Polyole wie Glycerin, 
Alkohole wie Methanol oder Ethanol, Carbonsauren wie Citronen- 
saure, Milchsaure oder Essigsaure, Fette wie Sojaol oder Rapsol, 
Aminosauren wie Glutaminsaure oder Asparaginsaure oder Amino - 
zucker, die auch gleichzeitig als Stickstoff quelle verwendet 
werden konnen. 

Vorteilhaf te Sticks toff quellen sind organische oder anorganische 
Stickstoff verbindungen oder Materialien, die diese Verbindungen 
enthalten. Beispiele sind Ammoniumsalze wie NH 4 C1 oder (NH 4 ) 2 S04, 
Nitrate, Harnstoff, oder komplexe Stickstoff quellen wie Maisquell- 
wasser, Bierhef eautolysat , Soj abohnenmehl , Weizengluten, Hefe- 
extrakt, Fleischextrakt , Caseinhydrolysat , Hefe oder Kartoff el- 
protein, die haufig auch gleichzeitig als Stickstof f quelle dienen 
konnen . 

Beispiele fur anorganische Salze sind die Salze von Calcium, 
Magnesium, Natrium, Mangan, Kalium, Zink, Kupfer und Eisen. 
Als Anion dieser Salze sind besonders das Chlor-, Sulfat- und 
Phospha.ti.on zu nennen. Ein wichtiger Faktor zur Steigerung der 
Produktivitat im erf indungsgemaBen Verfahren ist der Zusatz von 
Fe 2+ ~ oder Fe 3+ -Salzen und/oder Kaliumsalzen zum Produktionsmedium . 

Gegebenenf alls werden dem Nahrmedium weitere Wachs tumsf aktoren 
zugesetzt, wie beispielsweise Vitamine oder Wachs tumsf orderer wie 
Riboflavin, Thiamin, Folsaure, Nicotinsaure , Pantothenat oder 
Pyridoxin, Aminosauren wie Alanin, Cystein, Asparagin, Asparagin- 

saure, -Glutamin, -Serin, Methonin _od_er Lysiri,_ jCarbonsauren wie 

Citronensaure, Ameisensaure , Pimelinsaure oder Milchsaure, oder 
Substanzen wie Dithiothrei tol . 

Zur Stabilisierung der Vektoren mit den Biotingenen in den Zellen 
konnen gegebenenf alls Antibiotika dem Medium zugesetzt werden. 



WO 99/05285 



PCT/EP98/04097 



12 

Das Mischungsverhaltnis der genannten Nahrstoffe hangt von der 
Art der Fermentation ab und wird im Einzelfall festgelegt. Die 
Mediumkomponenten konnen alle zu Beginn der Fermentation vorge- 
legt werden, nachdem sie falls erforderlich getrennt sterilisiert 
5 oder gemeinsam sterilisiert wurden, oder aber je nach Bedarf 
wahrend der Fermentation nachgegeben werden. 

Die Zuchtungsbedingungen werden so festgelegt, da8 die Organismen 

optimal wachsen und daB die bestmoglichen Ausbeuten erreicht wer - 
1Q den. Bevorzugte Zuchtungstemperaturen liegen bei 15 °C bis 40 °C. 

Besonders vorteilhaft sind Temperaturen zwischen 2 5 °C und 37 °c. 

Vorzugsweise wird der pH-Wert in einem Bereich von 3 bis 9 fest- 

gehalten. Besonders vorteilhaft sind pH-Werte zwischen 5 und 8. 

Im allgemeinen ist eine Inkubationsdauer von 8 bis 24 0 Stunden 
15 bevorzugt von 8 bis 120 Stunden ausreichend. Innerhalb diser Zeit 

reichert sich die maximale Menge an Biotin im Medium an und/oder 

ist nach AufschluB der Zellen verfugbar. 

Das erf indungsgemaBe Verfahren zur Herstellung von Biotin kann 
kontinuierlich oder batch-weise durchgefiihrt werden. Werden aus 
den mit den Biotingenen transf ormierten Pf lanzenzellen ganze 
Pflanzen regeneriert, so konnen diese nach dem erf indungsgemaBen 
Verfahren ganz normal angeziichtet und vermehrt werden. 

Beispiele: 

25 

Ausgehend von der Uberlegung, daB an der Umsetzung von DTB zu 
Biotin aufier BioB und den bekannten weiteren Kofaktoren mogli- 
cherweise ein Fe-S-Cluster-regenerierendes Enzym beteiligt sein 
konnte, wurde der Versuch unternommen ein solches hypotetisches 
^ Gen zu identif izieren und zu klonieren. 

NifS-Gene sind in der Lage Schwef elatome in einem Fe-S-Cluster 
von Proteinen, die an der Stickstof f f ixierung beteiligt sind, zu 
regenerieren (Zheng et al., Proc. Natl. Acad. Sci . USA 90, 1993: 

35 2754 - 2758 und Biochemistry 33, 1994: 4714 - 4720). Durch Ver - 
gleich aller bekannten Proteine der NifS-Klasse in den Datenban- 
ken. Swiss-Prot und PIR mit dem Programmpaket Lasergene (DNA-Star 
Inc.) unter dem Megalign Modus, konnte ein streng konservier ter 
Bereich dieser Proteine mit der Aminosauresequenz HK(I,L)xGPxG 

40 ( x entspricht Aminosauren mit geringer bzw. nicht erhaltener Kon- 
servierung) identif iziert werden. Die Tatsache der vollstandigen 
Konservierung dieser Sequenz deutet auf eine wichtige Rolle 
dieser Aminosauren <= As) in der Funktion dieser Proteinen hin. 
Diese konservierten Aminosauren werden im folgenden als Motiv I 

45 bezeichnet. 
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Das derart beschriebene As-Motiv diente als Vergleichsequenz fur 
eine weitere Analyse der Datenbank Swiss-Prot/PIR Release 93 bzw, 
94 nach Proteinen bzw. ORF' s (= open reading frame) zu suchen, 
in denen diese Nif S-Funktionssequenz vollstandig konserviert ist. 
5 Als Programm fur die Sequenzanalyse wurde das Programm Geneman 
des Pakets DNA-Star eingesetzt. Die Analyseparameter wurden wie 
folgt fixiert: Menue "consensus sequence" mit einer 8 0% Konser- 
vierung des Motivs. 

10 Als Ergebnis dieser Recherche wurde gefunden, daB neben bereits 
als NifS-homolge Proteine ident if izierte Proteine weitere 
Proteine/ bzw. ORF' s existieren, die dieses Sequenzmotiv auf - 
weisen. Unter den in der Datenbank enthaltenen weiteren Sequenzen 
konnte ein offenes Leseraster aus E. coli mit signif ikanter 
Konservierung der Konsensus- Sequenz identif iziert werden, das wie 
die eigenen Arbeiten zeigten an der Biotinsyn these beteiligt ist. 
Dieses offene Leseraster mit der Bezeichnung ECU29581_24 (= SEQ 
ID No. 1 = ORF401) kodiert fur ein hypothet isches von dieser 
Sequenz abgeleitetes Protein von 401 As. Es zeigte sich, daB 
diese Sequenz im Rahmen der E. coli Genomsequenzierung durch 
F. Blattner und Mitarbeitern sequenziert worden war (DNA-Research 
1996), ohne daB dessen Funktion erkannt worden war. Diese Sequenz 
(SEQ ID No. 1) wird im Nachf olgenden als BioSl bezeichnet. 

vergleicht man die Proteinsequenz von BioSl mit der von NifS aus 
25 a. vinelandii (Programm: DNA-Star-"Megalign" im Modus: paarweises 
Alignement nach Lipman-Pearson, Analyseparameter: k- tuple 2, 
gap-penalty 4, gap-length-penalty 12) zeigt sich, daB ECU29581_24 
auch in anderen Bereichen der Sequenz uber einen Sequenzbereich 
von 218 As eine Homologie von 27,6% zu NifS aus A. vinelandii 
30 aufweist. Gegeniiber dem als NifS ident if izier tern Protein aus 
Rhodococcus capsulatus betragt die Homologie 25,3 % uber einen 
Bereich von 376 As. 

In der Datenbank Swiss-Prot/PIR konnten weitere Sequenzen identi- 
35 f iziert werden, die Homologien zu ECU29 58l_24 auf weisen (Programm 
Geneman/ Modus sequence similarity; Eins tellungen default) . Die 
hochste gefundene Sequenzahnlichkei t zu ECU29581_24 zeigt ein 
translatierter ORF (= open reading frame) aus H. influenza (Da- 
tenbankbezeichnung HIU00082_62 ) . Zwischen BioSl und HIU00082_62 
40 wurde eine Sequenzhomolgie von 4 5,5% uber die gesamte Lange bei- 
der-Protei-ne-gefunden — nie-Seguenzahnlichkei t bzw. die Homolog ie 



20 



beider Proteine ist damit significant hoher, als zwischen 
ECU29581_24 (= BioSl) und NifS aus R. capsulatus bzw. A. vine- 
landii. Es handelt sich damit vermutlich urn das H. influenza 
45 Homologe zu BioSl. 
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Von Fleischmann et al. (Science. 269, 1995: 496-512) war neben 
dem ORF HIU00082_62 ein weiterer ORF (HIU00072_10) in H. influ- 
enza aufgrund seiner Sequenzahnlichkei t zu NifS gefunden worden. 

5 Aufgrund dieser Beschreibung von Fleischmann et al. wurde ge- 
folgert, dafi neben bioSl auch in E. coli noch ein wei teres NifS- 
ahnliches Gen existiert. Dieses hypothetische Gen wurde bioS2 
genannt . 

10 1- Konstruktion der Vektoren pHSlund pHS2: 

Die Plasmide pHSl und pHS2 bestehen aus verschiedenen sog . 
Kassetten, die einen Replikationsur sprung, eine Resistenzkas - 
sette, einen Promotor, eine Klonierungss telle, und Terminatoren 
15 tragen. Die Plasmide wurden aus unterschiedlichen DNA-Fragmenten 
zusammengesetz t . Die dafur notwendigen DNA-Fragmente wurden durch 
PCR-Reaktionen mit unterschiedlichen Plasmiden als Matrizen her- 
gestellt . 

a. ) Herstellung der Kassette mit einem Replikationsursprung: 

« u 

Um den Replikationsursprung aus einem P15A-Replikon-enthal tenden 
Plasmid als klonierbare Kassette bereitzustellen, wurde durch 
eine PGR Reaktion mit dem Plasmid pRep4 (Quiagen) mit den Oligo- 
nukleotiden P15A, 1 { 5 ' -GGCCCCTAGGGGATATATTCCGCTTCCTCGC-3 ' ) und 
25 P15A,2 { 5 ' -GGCCACTAGTAACAACTTATATCGTATGGGG-3 ' ) ein DNA-Fragment 
von 919 Basen Lange aus dem Plasmid isoliert. Das Fragment wurde 
mit den Restriktionsenzymen Avrll und Spel in einem geeigneten 
Puffer geschnitten. 

30 

PCR-Bedingungen: 

Es wurden 2,5 U Taq- Polymerase sowie 15 pMol der Oligonukleotide 
in 100 jjI Ansatzlosung zur isolierung der Replikat ionskasset te 
aus dem Plasmid pRep4 verwendet. Die Oligonukleotide wurden bei 
35 50 °C angelagert. Die Elongation erfolgte bei 72 °C fur 1 min. 
iiber 30 Zyklen. 

b. ) Herstellung der Kanamyzin-Resis tenzkassette : 

40 Um eine Kanamyzin-Resis tenzkassette als klonierbare Kassette 
bereitzustellen wurde durch eine PCR Reaktion aus einem die 
Kanmyzin-Resistenzkassette enthal tenden Plasmid (pRep4, Quiagen) 
mit den Oligonukleotiden Kan-R, 1 ( 5 ' -GGCCGAGCTCTCGAACCCCA- 
GAGTCCCGCT-3 ' ) und Kan-R, 2 (5 ' -GGCCGACGTCGGAATTGCCAGCTGGGGCGC-3 ' ) 

45 ein DNA-Fragment von 952 Basen Lange isoliert. Das Fragment wurde 
mit Aatll und SacI in einem geeigneten Puffer geschnitten. 
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PCR-Bedingungen : 

Es wurden 2,5 U Taq-Polymerase sowie 15 pMol der Oligonukleotide 
in 100 |il Ansatzlosung zur Isolierung der Kanamyzin-Resistenz- 
kassette aus dem Plasmid pRep4 verwendet. Die Oligonukleotide 
wurden bei 50 °C angelagert. Die Elongation erfolgte bei 72 °C fur 
1 min. uber 30 Zyklen. 

c.) Herstellung der Terminationsbereiche : 

* Um den Terminator TO aus dem Phagen Lambda als klonierbare 
Kassette bereitzustellen wurde durch eine PCR Reaktion mit 
dem Plasmid pDS12-luzi (Schroder H. et al. , EMBO Journal. 12, 
11, 1993: 4137 - 4144) als Matrize mit den Oligonukleot iden 
TO , 1 ( 5 ' -GGCCGAGCTCGCTTGGACTCCTGTTGATAG-3 ' ) und TO , 2 

(5 ' -GGCCACTAGTGCTTGGATTCTCACCAATAAAAAACGCCC-3 ' ) ein DNA-Frag - 
ment von 120 Basen Lange isoliert. Das Fragment wurde durch 
die Enzyme Spel und SacI in einem geeigneten Puffer ge- 
schni tten. 

Matrize fur TO: pDS12-luzi 

Es wurden 2,5 U Taq-Polymerase sowie 15 pMol der Oligonukleo- 
tide in 100 jil Ansatzlosung zur Isolierung des Terminations - 
bereiches aus dem Plasmid pDS12-luzi verwendet. Die Oligo- 
nukleotide wurden bei 50 °C angelagert. Die Elonga'tion er- 
folgte bei 72 °C fur 0,5 min. uber 30 Zyklen. AnschlieBend 
wurde ein 120 bp groBes Fragment isoliert und auf gereinig t . 
Dieses wurde mit je 20 U Spel und SacI verdaut. 

* Um den Terminator Tl aus dem rrnB-Operon als klonierbare 
Kassette bereitzustellen, wurde durch eine PCR Reaktion mit 
dem Plasmid pDS12-luzi (Schroder et al . siehe oben) als 
Matrize und mit Hilfe der Oligonukleotide Tl,l ( 5 ' -GGCCCCTAG- 
GTCTAGGGCGGCGGATTTGTCC-3 ' ) und Tl , 2 ( 5 ' -GGCCTCTAGAGGCATCAAA - 
TAAAACGAAAGGC- 3 ' ) ein DMA-Fragment von 120 bp Lange isoliert. 
Das Fragment wurde durch die Enzyme Xbal und Avrll in einem 
geeigneten Puffer geschnitten. 

Matrize fur Tl : pDS12-luzi 



Es wurden 2,5 U Taq-Polymerase sowie 15 pMol der Oligonukleo- 
tide in 100 ^1 Ansatzlosung zur Isolierung des Terminations - 
bereiches aus dem Plasmid pDS12-luzi verwendet. Die Oligo- 
nukleotide wurden bei 50 °C angelagert. Die Elongation er- 
folgte bei 72 °C fur 0,5 min. uber 30 Zyklen. AnschlieBend 
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wurde ein 120 bp groBes Fragment isoliert und auf gereinigt . 
Dieses wurde mit je 20 U Xbal und Avrll verdaut. 

d.) Herstellung der Promotoren fur pHSl und pHS2 : 

5 

Die Oligonucleotide PPHS1,1 

( 5 ' -TCGAGATAGCATTTTTATCCATAAGATTAGCCGATCCTAAGGTTTACAATTGTGAGCGCTC 
ACAATTATGATAGATTCAATTGTGAGCGGATAACAATTTCACACACGCTAGCGGTAC- 3 ' ) und 
PPHS1, 2 

10 ( 5 ' -CGCTAGCGTGTGTGAAATTGTTATCCGCTCACAATTGAATCTATCATAATTGTGAGCGCTC 
ACAATTGTAAACCTTAGGATCGGCTAATCTTATGGATAAAAATGCTATC- 3 ' ) bzw. 
PPHS2 , 1 

( 5 ' - AATTCTCCCTATCAGTGATAGAGATTGACATCCCTATCAGTGATAGAGATACTGAGACATC 
ACCAGGACGCACTGACCG-3 ' 9 und 
15 PPHS2,2 

( 5 ' - AATTCGGTCAGTGCGTCCTGGTGATGTCTCAGTATCTCTATCACTGATAGGGATGTCAATC 
TCTATCACTGATAGGGAGG-3 ' ) wurden durch chemische Synthese herge - 
stellt. Die Oligonukleotide PPHS1,1 und PPHS1,2 sowie PPHS2 , 1 und 
PPHS2,2 wurden jeweils in einer Konzentration von lng/|il ver- 
20 mischt, 5 min bei 95 °C inkubiert und dann langsam abgekiihlt. Die 
aneinanderge lager ten Oligonukleotide wurden in einer Konzentra- 
tion von 10 ng/^il in der Ligation eingesetzt. Die Oligonucleotide 
PPHS1,1 und PPHS1,2 bildeten den Promoter fur das Plasmid pHSl 
und die Oligonucleotide PPHS2,1 und PPHS2 , 2 den fur das Plasmid 



e. ) Herstellung der Klonierungsstelle : 

Zur Konstruktion der Klonierungsstelle wurden die beiden Oligonu- 
kleotide PMCS1, 1 

( 5 ' -GTACCGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTGATATCGAATTCCTGCAGCC 
CGGGGGATCCCATGGTA-3 ' ) und PMCS1,2 

( 5 ' -ACGCGTACCATGGGATCCCCCGGGCTGCAGGAATTCGATATCAAGCTTATCGATACCGTCG 
ACCTCGAGGGGGGGCCCGGTACC-3 ' ) synthetisiert . Die beiden Oligonu- 
kleotide wurden in einer Konzentration von l^ig/^1 vermischt, 5 min 
bei 9 5 °C inkubiert und dann langsam abgekuhlt. Die aneinander- 
qelagerten Oligonukleotide wurden in einer Konzentration von 
10 ng/\xl in der Ligation eingesetzt. 

f. ) Klonierungsablauf von pHSl und pHS2 
40 

Ausgehend von pDS12 luci wurde die ampR-Kassette des Plasmides 
durch einen Sacl/Aat II-Verdau herausgeschni tten und durch ein 
entsprechendes Sacl/Aatll-Fragment ersetzt, das die Kanamyzin- 
Resitenzkassette enthalt. Nach Transformation und Isolierung 
45 positiver Klone wurde der erhaltene Vektor Spel/SacI verdaut und 
der durch PCR-amplif izierte Terminator TO als Spel/Sacl-Fragment 
stromabwarts der Kanamyz in-Resistenzkassette eingesetzt. Nach 



BNSOOCtO: <WO 9905285A1 > 



A 



WO 99/05285 



PCT/EP98/04097 



17 

Transformation und Isolierung positiver Klone wurde der erhaltene 
Vektor wurde mit Xbal/Avrll verdaut und dsr durch PCR-ampli- 
fizierte Terminator Tl als Xbal/Avrll-Fragment eingesetzt. Der 
erhaltene Vektor wurde mit XhoI/EcoRI verdaut und mit den jeweils 
5 aneinandergelagerten Promo toroligonukleotiden (PPHS1,1 und 

PPHS1,2 bzw. PPHS2,1 und PPHS2,2) ligiert. Der entstandene Vektor 
wurde Xbal verdaut und mit Hilfe von Klenow-Fragment aufgefullt, 
dann Kpnl verdaut und die Vektorbande ohne das Luzif erase-Frag - 
ment isoliert. Zwei weitere aneinandergelagerte Oligonukleotide 
(PMCS1,1 PMCS1,2), die die Klonierungsstelle enthalten, wurden 
mit den so verdauten Vektoren ligiert. 

2. Klonierung von bioSl (ECU29581_24 , SEQ ID No. 1): 

15 Das Gen, das fur BioSl kodiert, wurde aus dem Chromosom von 
E. coli durch eine PCR-Reaktion amplif iziert , mit otimierten 
Translationssignalen versehen und in einen Vektor kloniert, der 
eine Uberexpression des Gens in E. coli Stammen ermoglicht. 



10 



20 



a.) Entwicklung von Oligonukleotiden zur Amplif izierung des bioSl 
Gens aus dem E- coli Chromosom: 



BioSl soil als Expressionskassette bestehend aus einer ribosoma- 
len Bindungs telle, dem Startkodon der kodierenden Sequenz und dem 
Stopkodon zwischen zwei Erkennungstellen fur Restriktionsenzyme 
25 amplif iziert werden. Fur beide Restriktionsschni ttstellen wurde 
die Erkennungssequenz von Mlul gewahlt. Das bioSl Gen wurde mit 
Hilfe der Oligonucleotide PbioSl,l ( 5 ' -CGCACGCGTGAGGAGTACCAT - 
GAACGT-3 ' ) und PbioSl,2 { 5 ' -CGCACGCGTTTAATCCACCAATAATT-3 ' ) 
kloniert. 



30 



Durchfuhrung der PCR: 



Bedingungen : 

35 Als Matrize wurden 0,5^g chromosomale DNA von E. coli W3110 ver- 
wendet. Die Oligonukleotide PbioSl,l und PbioSl,2 wurden in einer 
Konzentration von je 15 pMol eingesetzt- Die Konzentra tion an 
dNTP's betrug 200 |JM. Als Polymerase wurden 2,5 U Pwo DNA-Poly- 
merase (Boehringer Mannheim) im Reaktionspuf f er des Herstellers 

40 eingesetzt. Das Volumen der PCR-Reaktion betrug 100^x1. 

Amplif ikationsbedingungen: 

Die Denaturierung der DNA erfolgte fur 2 min bei 94 °C . Anschlie- 
45 fiend wurden die Oligonukleotide fur 30 sec bei 55 °C angelagert. 
Die Elongation erfolgte fur 45 sec bei 72 °C . Die PCR-Reaktion 
wurde uber 30 Zyklen durchgef uhr t . 
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Das erhaltene DNA-Produkt mit einer GroBe von 1200 bp wurde auf- 
gereinigt und durch Mlul im geeigneten Puffer verdaut. 

Bug des Vektors pHSl wurden duch Mlul verdaut und durch Shrimp 
Alkalische Phosphatase (SAP) (Boehringer Mannheim) dephosphoryl- 
liert. Nach Denaturierung der SAP wurden Vektor und Fragment in 
einem molaren Verhaltnis von 1:3 durch den Rapid-DNA-Ligation Kit 
nach der Vorschrift des Herstellers ligiert. Die Transformation 
des Ligationsansatzes erfogte in den Stamm E. coli XL-l-blue. 
Positive Klone wurden durch Plasmidpraparation und Restr iktions- 
analyse identif iziert . Die richtige Orientierung des bioSl-Frag- 
ments in pHSl wurde durch Res tr iktionsverdau und Sequenzierung 
bestimmt. Das erhaltene Konstrukt wurde pHSl bioSl (Figur 1) ge- 
nannt. Die Sequenz von pHSl bioSl ist SEQ ID No. 5 zu entnehmen. 
Die abgeleitete Aminosauresequenz von bioSl im Vektor ist SEQ ID 
No. 6 zu entnehmen. 2 ng des Vektors pHSl bioSl wurden mit Mlul 
verdaut und das Gen bioSl durch ein Agarosegel isoliert. Der Vek- 
tor pHS2 wurde mit Mlul verdaut mit SAP-Phospahtase dephosphoryl - 
liert und mit dem Fragment bioSl zusamrnen in einer Ligation ange- 
setzt. Der Ligationsansatz wurde in XLl-blue transf ormiert und 
positive Klone in der richtigen Orientierung durch Plasmidisolie- 
rung und Restiktionsverdau identif iziert . Der erhaltenen Vektor 
wurde pHS2 bioSl (Figur 2) genannt. Die Sequenz von pHS2 bioSl 
ist SEQ ID No. 9 zu entnehmen. Die abgeleitete Aminosauresequenz 
von bioSl im Vektor ist SEQ ID No. 10 zu entnehmen. 

3. Klonierung von bioS2 (SEQ ID No. 3) : 

Urn in E. coli weitere Gene zu klonieren, die fur Genprodukte 
kodieren die am Aufbau von Fe-S-Clustern beteiligt sind, wurde 
folgender Weg beschritten: 

Ein Sequenzvergleich (Programm Megalingn, Modus Clustal) von As- 
Sequenzen von Proteinen der Datenbank Swisspro t/PIR mit einer 
hohen Homologie <>40%) zum NifS Protein aus A. vinelandii zeigte, 
5 daS neben dem bereits beschriebenen Sequenzmotiv I auch der N- 
Terminus dieser Proteine eine signifikante Konservierung zeigt. 
Als eine typische N-terminale konservierte Sequenz von Proteinen 
der NifS-Familie wurde die As-Sequenz mit der Sequenz M I YLDNXATT 
identif iziert und als Motiv II a bezeichnet. 

0 

Eine Analyse der Datenbank Swissprot/PIR auf eine Konservierung 
dieser Sequenz mit mehr als 80% zeigte ein weiteres Protein in 
E. coli. Von diesem Protein ist durch Edman-Abbau erhaltene 
N-terminale Sequenz von 11 As bekannt (Datenbankbezeichnung : 
5 UP06_Ecoli) . Dieses Protein wurde als hypothetisches NifS-Homolog 
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angesehen und in Analogie zu BioSl als im folgenen als BioS2 
bezeichnet. 

Urn das Gen fur das Protein BioS2 zu klonieren und zu sequenzie- 
5 ren f wurde folgender Weg beschritten. Ausgehend von der Protein- 
sequenz HIU00072_10 wurde zum einen das konservierte Aminosaure- 
Motiv I zum anderen die oben genannte As-Sequenz von UP06_Ecoli 
benutzt, urn degenerierte Ol igonukleotide herzustellen, die in der 
Lage sind, ein Fragment des bioS2 Gens zu amplif izieren . Dafur 
10 wurden die beiden As-Motive HIU00072_10 (Motiv I) und UP06__Ecoli 
(Motiv II b, MKLiPI YLDYSAT ) in die korrespondierenden DNA-Sequen- 
zen revers translatier t . Aus dem Motiv II wurde so das degene- 
rierte Oligonukleotid PbioS2,l ( 5 ' - ATGAARYTNCCNATHTAYYTNGAY - 
TAYWSNGCNAC-3 ' ) und aus dem Motiv I das degenerierte Oligonukleo- 
tid PbioS2,2 (5' -cccaghggrccrtgcagyttrtgrccrga-3' ) synthetisiert . 



15 



Durchfuhrung der PCR-Reaktion: 



Als Matrize diente chromosotnale DNA von E. coli W3110. Je 0,5 \ig 
der Oligonukleotide Pbio2 , 1 und PbioS2,2 wurden mit je 15 pMol - 
20 Nukleotidmix, 2,5 U Pwo DNA- Polymerase (Boehringer Mannheim) im 
Reaktionspuf f er des Herstellers umgesetzt. Das Volumen der PCR- 
Reaktion betrug 100^1. 



25 



Ampl if ikat ionsbedingungen : 



30 



Die Denaturierung erfolgte fur 2 min bei 94 °C. Die Anlagerung der 
Oligonukleotide wurde bei 45 °C, die Elongation fur 45 sec bei 
72 °C durchgefuhrt . Die PCR wurde uber 30 Zyklen durchgefuhrt. 
Durch die PCR konnten drei Fragmente selektiv amplif iziert wer- 
den, von denen eines die aus den Sequenzvergleichen erwartete 
GroGe von 600 bp hatte. Dieses DNA-Fragment wurde durch Agarose - 
gel-Auf reinigung isoliert und mit dem Oligonukleotid PbioS2,2 
sequenziert . Die erhaltene. DNA-Sequenz wurde in alien sechs mog- 
lichen Leserastern translatiert . Die erhaltenen translatierten 
35 As-Sequenzen wurden dann mit der translatierten AS-Sequenz von 
HIU00072_10 bzw. NifS aus A. vinelandii verglichen. Eines der 
translatierten Leseraster zeigt eine hohe Homologie mit der 
As-Sequenz des beschr iebenen ORF HIU00072_10 und mit bioS2 
bezeichnet . 

40 

Um-dre-gesamte-DNA-Sequenz-von-bioS2_ (^_SEQ_ip__ No . 3) zu be; 

stimmen und zu klonieren, wurde folgender Weg beschritten: 

Zuerst wurde eine markierten DNA-Sonde hergestellt, die zu bioS2 
45 homolog ist. Dies geschah mit Hilfe des PCR-DIG-Labelling-Ki t 
(Boehringer Mannheim) . Als Matrize fur die Herstellung der DIG- 



BNSDOC1D: <WO 99052B5A1 > 



WO 99/05285 



PCT/EP98/04097 



20 

DNA- Sonde diente das beschriebene PCR-Produkt, das durch die 
Oligonukleotide PbioS2,l und PbioS2,2 hergestellt wurde. 

Die Bedingungen der PGR waren: 

5 

Einsatz: 1^1 der PCR-Matrize, 5|il Nukleotid-DIG-dUTP-Mix, je 

15 pMol Oligonukleotid PbioS2,l und PbioS2,2, Puffer des Kits mit 

1,75 mM MgCl 2 0,75 jil Expand-Polymerase-Mix (Boehringer Mannheim), 

Amplif ikat ionsbedingungen: 

Aufschmelzen der DNA bei 94 °C fur 2 min, Auf schmelzen der DNA 
10 sec bei 94 °C, Annealing 30 sec bei 45 °C, Elongation 3.30 min 
bei 68 °C uber 10 Zyklen, Aufschmelzen der DNA 10 sec bei 94 °C, 
15 Annealing 30 sec bei 45 °C, Elongation 3.30 min bei 68 °C, Ver- 
langerung der Elongation fur 20 sec pro Zyklus uber 20 Zyklen. 
Aufreinigung des DIG-markierten Frgaments durch PCR- Purification 
Kit. 

4. Southern-Analyse von bioS2 mit chromosomaler DNA 

a u 

In weiteren Schritten wurde genomische DNA durch Restriktions- 
enzyme verdaut und durch Southern-Hybridisierung mit Hilfe der 
markierten DNA-Sonde analysiert. 

25 

Chromosomale E . coli DNA W3110 (lOfxg) wurde mit den folgenden 
Restriktionsenzymen vollstandig verdaut EcoRI, BamHl, Acc6 5I, 
Hindlll, Sail. Das Volumen der Ansatze betrug 50 \xl, die Enzym- 
menge je 3 0 U. Die Ansatze wurden 4h inkubiert. Die derart ver- 
daute DNA wurden durch ein 1% Agarosegel in TBE-Puffer (Sambrook, 

30 J. Fritsch, E F. Maniatis, T. 2nd ed. Cold Spring Harbor 

Laboratory Press., 1989, ISBN 0-87969-373-8) aufgetrennt und 
mit Hilfe einer Druckubertragungskammer (Stratagene) auf eine 
Nylon-Membran (Boehrineger Mannheim) iibertragen und durch UV- 
Bestrahlung (Stratalinker , Stratagene) kovalent an der Membran 

35 fixiert. Die Hybridisierung erfolgte mit der DIG-markierten DNA- 
Sonde in DIG-Easyhyb Puffer (Boehringer Mannheim) bei 65 °C fur 15 
h. Die Entwicklung des Blots nach Anweisungen des Hersteller 
zeigt Hybridisierung der BioS 2 -DIG- DNA- Sonde mit Banden, die mit 
Grdfien von ca. 3 - 4 kb im Fall von Acc65I, EcoRI und Hindi! 

40 bestimmt wurden. BamHl verdaute DNA zeigte eine Hybridisierung 
mit der bioS2-Sonde mit einem Fragment eines wesentlich hoheren 
Molekulargewichts . Zur weiteren Klonierung wurden Fragmente von 
3 - 4 kb bevorzugt weiter bearbeitet. 

45 
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Klonierung von bioS2 durch inverse PCR 

Im Fall des EcoRI-Verdaus wurde ein Fragment von ca. 4 kb identi- 
fiziert, das das gesuchte Gen tragt. Das gesamte Gen wurde dann 
5 durch die Technik der inversen PCR amplif iziert und kloniert. Im 
ersten Schritt der inversen PCR wurde chromosomale E. coli DNA 
durch EcoRI vollstandig verdaut. Im zweiten Schritt wurde dann 
die EcoRI verdaute DNA bei geringen DNA-Konzentrationen (ca.20 
ng/ml) aus dem vorher beschriebenen Restr iktionsverdau durch Li- 
10 gase kovalent ligiert, unter Bedingungen unter denen statistisch 
gesehen eine intramolekulare Verknvipfung erfolgt. Im dritten 
Schritt wurde dann eine PCR-Reaktion durchgef uhrt , bei der Oligo- 
nukleotide eingesetzt werden, deren Sequenz spezifisch fur das 
gesuchte Zielgen ist. 

15 Spezifisch amplif izierte DNA-Segemente konnen anhand ihrer GroBe 
identif iziert werden, die sich aus der GroBe des Restriktions- 
fragments aus der Southern- Analyse und aus der Lokalisierung der 
Oligonukleotide im bekannten Abschnitt des Gens ergibt. Derart 
identif izierte Fragmente werden dann in einen geeigneten Vektor 
wie pBS SK Blueskript/ pCR Script (Stratagene) kloniert und 
sequenz ier t . 

Experimentelle Durchf uhrung : 

25 lug chromosomale DNA aus dem Stamm W3110 wurde durch 15 U EcoRI 
(Boehringer Mannheim) in einem Volumen von 50 \xl vollstandig ver- 
daut. Die Vollstandigkeit des Verdaus wurde durch Auftrag von 
30 ^tl auf ein Agarosegel uberpruf t. Fragmente dieses Verdaus 
chromosomaler DNA (10 |al des Verdaus = 2 00 ng) wurden in einem 

30 Volumen von 100 jal zusammen mit 10 ^il Ligationspuf f er und 

2 U T4-Ligase (Boehringer Mannheim) fur 15h bei 15 °C inkubiert. 
(intramolekulare Ligationsreaktion) . Nach der Ligationsreaktion 
wurde die T4-Ligase durch Inkubation bei 65 °C fur 20 min. 
inaktiviert. Von diesem Ligationsansatz wurden 5 jal als Matrize 

35 fur eine PCR-Reaktion eingesetzt. Die Primer PbioS2,3 

( 5 ' -GCGTGGGTAAACTGCCTATCGACCTGAGCC-3 ' ) und PbioS2 , 4 ( 5 ' -CTACGCTT- 
CCTTCAGCCTGCCAGCCGAAA-3' ) wurden ausgehend von der Sequenz von 
bioS2 synthetisiert . 

40 oiigonukleotid PbioS2,3 hybridisiert auf der 5'-Seite von bioS2 
und bewirkt das die Elongation der. Ampl if ikat ion de_r__kodierenden 
Sequenz auf der 5'-Seite auf dem Gegenstrang in 3'-Richtung 
stattfindet. 



20 
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Oligonukleotid PbioS2,4 hybridisiert auf der 3'-Seite von bioS2 
und bewirkt das die Elongation der Amplif ikation der kodierenden 
Sequenz auf der 3'-Seite auf dem kodierenden Strang in 3' -Rich - 
tung stattfindet. 

Einsatz: 5|il des Ligationsansat z , 1,75 ul Desoxynukleot id-Mischung 
(350 ^mol, Boehringer Mannheim), je 15 pMol Oligonukleotid 
PbioS2,5 und PbioS2 / 6, Puffer Ides Kits mit 1,75 mM MgCl 2 0,75 \il 
Expand-Polymerase-Mix. 

Bedingungen fur die Amplif ikation der ligierten E. coli DNA mit 
Primer PbioS2,3/ PbioS2,4. Expand-Kit (Boehringer Mannheim) Auf- 
schmelzen der DNA 2 min bei 94 °C, Aufschmelzen der DNA 10 sec bei 
94 °C, Annealing 30 sec bei 61 °C, Elongation 3.30 min bei 68 °C 
uber 10 Zyklen, Aufschmelzen der DNA 10 sec bei 9 4 °C, Annealing 
3 0 sec bei 61 °C, Elongation 3.30 min bei 68 °C, Verlangerung der 
Elongation fur 20 sec pro Zyklus uber 20 Zyklen. 

Durch die beschriebene Amplif ikation wurde ein PCR-Produkt von 
ca. 3 kb erhalten. Dieses DNA-Fragment zeigte in einer Southern- 
Hybridisierung unter stringenten Bedingungen eine deutliche 
Hybridisierung mit der bereits beschriebenen bioS2-DIG-DNA- Sonde. 

Es wurde angenommen, dafi dieses DNA-Fragment DNA-Sequenzen ent- 
halt, die zu bioS2 hochgradig homolog sind. Daher wurde dieses 
DNA-Fragment in einen Vektor kloniert, urn es weiter zu charakte- 
risieren und zu sequenzieren . Das DNA-Fragment wurde mit dem pCR- 
Skript Kit (Stratagene) zuerst laut Anweisung des Herstellers 
mit Pf u-Polymerase behandelt und dann in den Vektor pCR Skript 
ligiert. Der Ligationsansatz wurde in XL-l-blue Zellen (Strata- 
gene) transf ormiert und auf LB-Amp ausplattiert . Ein positiver 
Klon, der ein Fragment trug, wurde durch Minipraparationsanalyse 
identif iziert . Die Sequenzierung ergab die in SEQ ID No. 3 
wiedergegebene Gesamtsequenz (= bioS2) . 

BioS2 wurde dann als Expressionskassette analog zu bioSl amplif i- 
ziert und kloniert. Dafiir wurden dem Gen durch PCR mit den Oligo- 
nukleotiden PbioS2 ,5 ( 5 ' -CATGACGCGTAAAGAGGAGAAATTAACTATGAAATTAC- 
CGATTTATTTGG- 3 ' ) und PbioS2 ,6 ( 5 ' -GCGACGCGTGATTAATGATGAGCCCAT- 3 ' ) 
eine Erkennungs telle fur Mlul und eine optimierte Shine-Dalgarno- 
Sequenz auf der 5'Seite und eine Erkennungs telle fur Mlul auf der 
3'Seite zugefugt. 

Durchfuhrung der PCR: 

Als Matrize wurden 0,5 jag chromosomale DNA von W3110 eingesetzt. 
Die Oligonukleotide PbioS2,5 und PbioS2,6 wurden in einer Konzen- 
tration von je 15 pMol eingesetzt. Die Konzentration an dNTP's 
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betrug 200 nM. Als Polymerase wurden 2,5 U Pwo DNA-Polymerase 
(Boehringer Mannheim) im Reaktionspuf f er des Kerstellers ein- 
gesetzt. Das Volumen der PCR-Reaktion betrug 100 \xl . 

5 Amplif ikationsbedingungen: 

Denaturierung 2 sec bei 94 °C, Anlagern der Oligonukleotide fur 
30 sec bei 55 °C, Elongation fur 45 sec bei 72 °C. Die PCR wurde 
uber 30 Zyklen durchgef uhrt . 

10 Das erhaltene DNA-Produkt der richtigen GroBe von ca. 1200 bp 
wurde durch den PCR- Purification-Kit (Boehringer Mannheim) auf - 
gereinigt und durch Mlul im geeigneten Puffer verdaut. 

15 5 jig des Vektors pHS2 wurden duch Mlul verdaut und durch Shrimp 
Alkalische Phosphatase (SAP) (Boehringer Mannheim) dephosphoryl - 
liert. Nach Denaturierung der SAP wurden Vektor und Fragment in 
einem molaren Verhaltnis von 1:3 durch den Rapid-DNA-Ligation Kit 
nach der Vorschrift des Herstellers ligiert. Die Transformation 
20 des Ligationsansatzes erfolgte in den Stamm XL-l-blue. Positive 
Klone wurden durch Plasmidpraparation und Restriktionsanalyse 
identif iziert. Die richtige Orientierung des bioS2-Fragments in 
pHS2 wurde durch Res triktionsverdau und Sequenzierung bestimmt. 
Der Vektor wurde mit pHS2 bioS2 (Figur 3) bezeichnet. Die Sequenz 
25 von pHS2 bioS2 ist SEQ ID No. 11 zu entnehmen. Die abgeleitete 
Aminosauresequenz von bioS2 im Vektor ist SEQ ID No. 12 zu ent- 
nehmen. Analog wurde die Klonierung von bioS2 in den Vektor pHSl 
vorgenommen. Die Sequenz von pHSl bioS2 ist SEQ ID No. 7 zu ent- 
nehmen (Figur 4). Die abgeleitete Aminosauresequenz von bioS2 im 
Vektor ist SEQ ID No. 8 zu entnehmen. 



30 



Konstruktion des Plasmids pHBbio!4 



Die in vivo-Klonierung des Bio-Operons wurde durch einen tr.ans.du- 
35 zierenden Lambda-Phagen durchgef uhrt . Die Selektion von Lambda 
bio + Phagen erfolgte durch die Transduktion eines E. coli bio- 
negativen Stammes zu bio*. Der isolierte bio + transduzierende 
Lambda Phage wurde propagiert und die Lambda DNA auf gereinigt . Es 
folgte die Excision eines 8,7 kb EcoRI/HinDIII-Fragments mit dem 
4Q gesamten Biotin-Operon aus der Lambda-Phagen DNA und Ligation des 

Fragments, in pBR32 2, der E co RI/HinDIII geschni tten worden war. 

Positive Klone wurden durch P 1 asmi dp r apa r a t i on und~Res~tr iK :t"i" oris- 
analyse identif iziert . 
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Deletion eines 1,2 Kb Fragments 3' von bioD 

Nicht benotigte Gensequenzen auf der 3'-Seite des bioD Gens wur- 
den entfernt. Dafur wurde durch PCR-Reaktion hinter dem Stopkodon 
von bioD eine EcoRI-Schni ttstelle eingebaut . Die Entwicklung der 
Oligonukleotide Pbiol, 1 (5' -AATAAGGAATTCTTATGTACTTTCCGGTTGCCG-3 ' ) 
und Pbiol, 2 ( 5 ' -AACAGCAGCCTGCAGCTGGATTA-3 ' ) fur diese PCR-Reak- 
tion erfolgte nach der Operon-Sequenz von Otsuka et al . (J. Biol. 
Chem. 263, 1988: 19577-85). 

PCR-Bedingungen : 

2,5 U Taq- Polymerase (Perkin Elmer) und je 15 pmol Primer wurden 
in einem Volumen von 100 |al umgesetzt. Das Annealing wurde bei 
50 °C und die Elongation fur 1 min bei 72 °C iiber 30 Zyklen 
durchgef uhrt . Isolierung und Aufreinigung eines 488 bp-Fragments 
erfolgte iiber Agarose-Gel. Verdau des erhaltenen Fragments mit 
EcoRI/Pstl. Verdau von pKBbiol mit EcoRI/Pstl. Isolierung eines 
9,5 kb Fragments. 

Das 9,5 kb Fragments wurde mit dem 4 88 bp Fragments legiert und 
in XL-l-blue-Zellen transf ormiert . Erhaltene Klone wurden durch 
Plasmidpraparation und durch Restrikt ionsanalyse der Plasmid-DNA 
mit den Enzymen EcoRI und HinDIII analysiert, positive Klone, die 
ein 5,9 kb Fragment trugen, wurden ident if iz iert . Es wurde ein 
Klon, der mit pHBbio2 bezeichnet wurde, isoliert. Von diesem Klon 
wurde Plasmid-DNA gewonnen. 5 |^g pHBbio2 wurden mit EcoRI/HinDIII 
verdaut und das 5,9 kb Fragment isoliert, das die gesamten Bio- 
tin-Biosynthesegene enthielt. 

5 ^ig des Plasmids pAT153 wurden mit EcoRI und HinDIII verdaut. 
Das erhaltenen 5,9 kb Fragment mit den Biotin-Biosynthesegenen 
wurde mit dem verdauten Vektor pAT153 ligiert und in XL-l-blue 
transf ormiert . Erhaltene Klone wurden durch Plasmidpraparation 
und durch Restriktionsanalyse der Plasmid-DNA mit den Enzymen 
EcoRI und HinDIII analysiert. Positive Klone wurden identif iziert 
und ein Klon mit der Bezeichnung pHbiol4 isoliert. 

6. Erhohung der Biotin-Produktivi tat durch Uberexpression von 
bioSl 

Stamm BM4 09 2 (Barker und Campbell) wurde durch eine Pl-Transduk- 
tion mit Hilf e eines Pl-Lysats, das auf einem recA: :Tnl0 tragen- 
dem Stamm gewachsen war, nach recA" transduziert . Der Erfolg der 
Transduktion wurde durch eine erhohte UV-Sensitivitat der positi- 
ven Transduktanden nachgewiesen. Daraufhin wurde der erhaltene 
Stamm LU8091 mit dem Plasmid pHBbiol4 nach der CaCl2~Methode 
transf ormiert und auf LB-Ampizillin 100 |ig/ml angezogen. Ein Klon 
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wurde isoliert, und dieser wurde jeweils mit den Plasmiden pHSl 
bioSl und pHS2 bioS2 durch die CaCl2-Methode transf ormiert und auf 
LB-Agar, Ampizillin 100 [ig/ml und Kanamyzin 25 ng/ml selektio- 
niert . 

Je eine Kolonie der jeweiligen Transf ormanden wurde in einer DYT- 
Kultur mit dem entsprechendem Antibiotika angeimpft und fur 12 h 
inkubiert. Die Ubemachtkultur (= UNK) wurde eingesetzt urn eine 
10 ml Kultur in TB-Medium (Sambrook, J. Fritsch, E F. Maniatis, 
T. 2nd ed. Cold Spring Harbor Laboratory Press., 1989 ISBN 
0-87969-373-8) mit den entsprechenden Antibiotika anzuimpfen und 
uber 24h Stunden angezogen. Nach Ende des Wachs turns wurden die 
Zellen vom Kulturuber stand durch Zentrif ugation abgetrennt und 
die Biotin- und Dethiobiotin-Konzentration durch einen ELISA mit 
Streptavidin und Avidin im Uberstand bestimmt. Die Ergebnisse 
dieser Bestimmung sind Tabelle I zu entnehmen. 

Tabelle I: Bestimmung der Biotin- und De thiobiotinkonzentration 



Stamm 


Plasmid I 


Plasmid II 


Biotin mg/1 


Dethiobiotin mg/1 


Lu8091 


pHBbiol4 




9,4 


45,6 


Lu8091 


pHBbiol4 


pHSl bioSl 


15, 3 


19, 7 


LU8091 


pHBbiol4 


pHS2 bioSl 


19, 2 


15, 8 
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Pa ten t anspruche 

1. Verfahren zur Herstellung von Biotin, dadurch gekennzeichnet , 
daB man ein Biotingen mit der Sequenz SEQ ID No. 1 Oder 

SEQ ID No. 3 sowie seine f unktionellen Varianten, Analoge 
oder Derivate in einem prokaryontischen Oder eukaryontischen 
Wirtsorganismus, der in der Lage ist Biotin zu synthetisie- 
ren, expr imiert , diesen zuchtet und das synthetisierte Biotin 
direkt, nach Abtrennung der Biomasse Oder nach Reinigung des 
Biotins verwendet. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , daB die 
Expression der Biotingene nach Anspruch 1 zu einer gesteiger- 
ten Umwandlung von Dethiobiotin in Biotin fiihrt. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daB 
es sich bei den Varianten um Gene handelt, die auf der von 
den Sequenzen nach Anspruch 1 abgeleiteten Aminosaureebene 
eine Homologie von 40 bis 100 % aufweisen und eine gestei- 
gerte Biotinsynthese ermoglichen. 

4. Verfahren nach den Anspriichen 1 bis 3, dadurch gekennzeich- 
net, daB als Wirtsorganismus ein Organismus ausgewahlt aus 
der Gruppe der Gattungen Escherichia, Citrobacter, Serratia, 
Klebsiella , Salmonella, Pseudomonas , Comamonas , Ac'inetobac- 
ter, Azotobacter, Chromobacterium, Bacillus, Chlostridium, 
Ar throbacter , Corynebacterium, Brevibacterium, Lactococcus, 
Lactobacillus, Streptomyces , Rhizobium, Agrobacterium, Sta- 
phylococcus, Rhodotorula, Sprorobolomyces , Yarrowia, Schizo- 
saccharomyces oder Saccharomyces verwendet wird. 

5. Verfahren nach den Anspruchen 1 bis 4, dadurch gekennzeich- 
net, daB als Wirtsorganismus eine regulationsdef ekte Biotin - 
mutante verwendet wird. 

6. Verfahren nach den Anspriichen 1 bis 5, dadurch gekennzeich- 
net, daB die Expression mindestens einer Kopie der Biotingene 
nach Anspruch 1 allein oder mit einer oder mehreren Kopien 
mindestens eines weiteren Biotingens ausgewahlt aus der 
Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, 
bioY oder bioR in einem prokaryontischen oder eukaryontischen 
Wirtsorganismus er f olgt . 

7. Genkonstrukt enthaltend ein Biotingen mit der SEQ ID No. 1 
oder SEQ ID No. 3, sowie seine f unktionel len Varianten, 
Analoge oder Derivate, das mit einem oder mehreren Regu- 
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lationssignalen zur Erhohung der Genexpression und/oder 
Proteinexpression funktionell verknupft ist und/oder dessen 
natvirliche Regulation ausgeschal tet wurde. 

5 8. Genkonstrukt nach Anspruch 7, dadurch gekennzeichnet , daB es 
in einem Vektor inseriert wurde, der fur die Expression des 
Gens in einem prokaryontischen Oder eukaryont ischen Wirts- 
organismus geeignet ist, 

10 9. Genkonstrukt nach Anspruch 7 oder 8, dadurch gekennzeichnet, 
daB die Biotingene nach Anspruch 7 in einer oder mehreren 
Kopien zusammen mit einer oder mehreren Kopien mindestens 
eines v wei teren Gens ausgewahlt aus der Gruppe bioA, bioB, 
bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY oder bioR 

15 im Vektor vorliegt. 

10. Organismen enthaltend ein Genkonstrukt gemaS den Anspruchen 7 
bis 9. 

20 11. Verwendung einer Sequenz gemaB Anspruch 1 zur Herstellung von 
Biotin. 

12. Verwendung eines Genkonstrukt s gemafi den Anspruchen 7 bis 9 
zur Herstellung von Biotin. 
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r \ 



1 Aatl 



Bal I 3445 
Tthl 1 1 I 3407 



Bg! tl 3689 
Bel i 3684 
Eagl 3619 
Drdl 3498 t ^ 



BsaAl 3223 

Sphl 3124 
Nae f 3025 
Ava II 3010 
Rsrll 3009 



Sac I 2839 
Sac I 2839 
Spe I 2727 

Xbal 2657 
Sspl 2651 
Ase I 2638 
Sful 2551 
BstBI 2551 




428 Aocl 
447 Eco47 111 
500 Nhe I 
506 Asp718 
506 Kpn I 
536 Cla I 
542 HinDIli 
554 EcoR I 
566 Sma I 
566 Xma I 
572 BamHl 
589 Mlu I 




3794 base pairs 
Unique Sites 



Agel 2225 




7 Dralll 



Avrll 1924 



1873 
Mlu I 



1651 Bgll 
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Bgl II 3360 
Bel t 3355 
Eag I 3290 
3169 



1 Aatll 
23 BspH I 
68 Bbvll 

177 Asp718 
177 Kpn I 
183 Apal 
183 iApa I 
198 Acc I 
198 Sal I 
207 Cla I 
213 HinDHI 
237 Smal 
237 Xma I 
243 BamH I 
Mlu 



Tth1 



BsaAl 2894 



Sphl 2795 
Nae I 2696 
Ava II 2681 
Rsrll 2680 



iSacl 2510 
Sac i 2510 

Spel 2398 

Xbal 2328 
Sspl 2322 
Asel 2309 
Sful 2222 
BstBI 2222 




1028 Drain 



1322 Bgll 



Agel 1896 



1478 Mlu I 
1595 Avrll 



BNSDOCID: <WO 9905285A1> 



WO 99/05285 



3 / 4 



PCT/EP98/04097 



1 Aatll 
23 BspH I 
68 Bbvll 
177 
177 
183 
183 
198 



Asp718 
Kpn I 
Apa I 
iApa I 
Acc I 



Xcm I 3394 
Bgl II 3376 
Bet I 3371 
Eag I 3306 
Drdl 3185 
Ball 3132 
Fspl 3112 
Tth11 1 ! 3094 



198 Sail 
207 Cla I 
213 HinD tit 
237 Smal 
237 Xmal 
243 BamHI 
313 BstXI 
316 SgrAI 



SphI 2811 

Nael 2712 
Rsrll 2696 : 



iSacI 2526 " 
Sac I 2526 

Spe I 2414 

Xba I 2344 
Ssp I 2338 
Ase I 2325 
Sfu I 2238 
BstB I 2238 

AlwN I 2100 





3481 base pairs 
Unique Sites 




618 Gsui 



— 824 PflMI 
870 Earn 11051 
• 947 SpII 

1039 Stul 



1751 



-\ 1495 Mlu. I 
1611 Avrll 
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P^r L, 



1 Aat II 



Xcml 3723 
Bgl II 3705 
Bel I 3700 
Eag I 3635 
Drdl 3514 



Ball 3461 
Fspl 3441 
Tth111 I 3423 



Sph ! 3140 



Nae I 3041 
Rsrll 3025 



iSac I 2855 
Sac I 2855 
Spe I 2743 

Xbal 2673 
Sspl 2667 
Asel 2654 

Sfu I 2567 
BstB I 2567 

AlwN I 2429 



428 Aocl 
447 Eco47 III 
500 Nhel 
506 Asp718 
506 Kpn I 
536 Clal 
542 HinDIII 
554 EcoR I 
566 Sma I 
566 Xmal 
572 BamHI 
642 BstX I 
645 SgrAI 



_ 947 Gsu I 




1153 PflM I 
1199 Earn 11051 



Agel 2241 

Hga I 2137 
Sac II 2080 



Avrll 1940 



BNSOOCID: <WO 9905285A1 > 



WO 99/05285 PCT/EP98/04097 

1 / 31 



SEQUENZ PROTOKOLL 

(1) ALGEMEINE INFORMATION: 

( i ) ANMELDER : 

(A) NAME: BASF Akt iengesellschaf t 

(B) STRASSE: Carl Bosch Strasse 

(C) ORT: Ludwigshafen 

(D) BUNDESLAND: Rheinland-Pf al z 

(E) LAND: Germany 

(F) POSTLEITZAHL : D-67056 

(ii) ANMELDETITEL: Verfahren zur Herstellung von Biotin 
(iii) ANZAHL DER SEQUENZEN: 12 



(iv) COMPUTER- LESBARE FORM: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: Patentln Release #1.0, Version #1.25 (EPA) 
(2) INFORMATION ZU SEQ ID NO : 1: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1217 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Escherichia coli 

(B) STAMM: W3110 

( ix ) MERKMALE : 

(A) NAME/ SCHLUSSEL : 5 ' UTR 

(B) LAGE: 1 . . 11 

(ix) MERKMALE: 

(A) NAME/ SCHLUSSEL: CDS 

(B) LAGE: 12.. 1217 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 

CGAGGAGTAC C ATG AAC GTT TTT AAT CCC GCG CAG TTT CGC GCC CAG TTT 50 
Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe 
15 10 
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CCC GCA CTA CAG GAT GCG GGC GTC TAT CTC GAC AGC GCC GCG ACC GCG 9 8 

Pro Ala Leu Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala 
15 20 25 

CTT AAA CCT GAA GCC GTG GTT GAA GCC ACC CAA CAG TTT TAC AGT CTG 146 
Leu Lys Pro Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu 
30 35 40 45 

AGC GCC GGA AAC GTC CAT CGC AGC CAG TTT GCC GAA GCC CAA CGC CTG 194 
Ser Ala Gly Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu 

50 55 60 

ACC GCG CGT TAT GAA GCT GCA CGA GAG AAA GTG GCG CAA TTA CTG AAT 24 2 

Thr Ala Arg Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn 
65 70 75 

GCA CCG GAT GAT AAA ACT ATC GTC TGG ACG CGC GGC ACC ACT GAA TCC 290 
Ala Pro Asp Asp Lys Thr He Val Trp Thr Arg Gly Thr Thr Glu Ser 
80 85 90 

ATC AAC ATG GTG GCA CAA TGC TAT GCG CGT CCG CGT CTG CAA CCG GGC - 338 
He Asn Met Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly 
95 100 105 

GAT GAG ATT ATT GTC AGC GTG GCA GAA CAC CAC GCC AAC CTC GTC CCC 386 
Asp Glu He He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro 
H0 115 120 125 

TGG CTG ATG GTC GCC CAA CAA ACT GGA GCC AAA GTG GTG AAA TTG CCG 4 34 

Trp Leu Met Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro 

130 135 140 

CTT AAT GCG CAG CGA CTG CCG GAT GTC GAT TTG TTG CCA GAA CTG ATT 4 82 

Leu Asn Ala Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He 
145 150 155 

ACT CCC CGT AGT CGG ATT CTG GCG TTG GGT CAG ATG TCG AAC GTT ACT 530 
Thr Pro Arg Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr 
160 165 170 

GGC GGT TGC CCG GAT CTG GCG CGA GCG ATT ACC TTT GCT CAT TCA GCC 578 
Gly Gly Cys Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala 
175 180 185 

GGG ATG GTG GTG ATG GTT GAT GGT GCT CAG GGG GCA GTG CAT TTC CCC 6 26 

~ Gry-Met- Val-Val-Met-Va-l- - A - S p-G-l-y-Al-a-G-l-n-G-l-y-Aia-Va,l-Hi.s-Ehe_Pro 

190 195 2 00 205 

GCG GAT GTT CAG CAA CTG GAT ATT GAT TTC TAT GCT TTT TCA GGT CAC 674 
Ala Asp Val Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His 

210 215 220 
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AAA CTG TAT GGC CCG AC A GGT ATC GGC GTG CTG TAT GGT AAA TCA GAA 7 22 

Lys Leu Tyr Gly Pro Thr Gly lie Gly Val Leu Tyr Gly Lys Ser Glu 
225 230 235 

CTG CTG GAG GCG ATG TCG CCC TGG CTG GGC GGC GGC AAA ATG GTT CAC 770 
Leu Leu Glu Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His 
240 245 250 

GAA GTG AGT TTT GAC GGC TTC ACG ACT CAA TCT GCG CCG TGG AAA CTG 818 
Glu Val Ser Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu 
255 260 265 

GAA GCT GGA ACG CCA AAT GTC GCT GGT GTC ATA GGA TTA AGC GCG GCG 866 
Glu Ala Gly Thr Pro Asn Val Ala Gly Val lie Gly Leu Ser Ala Ala 
270 275 280 285 

CTG GAA TGG CTG GCA GAT TAC GAT ATC AAC CAG GCC GAA AGC TGG AGC 914 
Leu Glu Trp Leu Ala Asp Tyr Asp lie Asn Gin Ala Glu Ser Trp Ser 

290 295 300 

CGT AGC TTA GCA ACG CTG GCG GAA GAT GCG CTG GCG AAA CGT CCC GGC 962 
Arg Ser Leu Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly 
305 310 315 

TTT CGT TCA TTC CGC TGC CAG GAT TCC AGC CTG CTG GCC TTT GAT TTT 1010 
Phe Arg Ser Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe 
320 325 330 

GCT GGC GTT CAT CAT AGC GAT ATG GTG ACG CTG CTG GCG GAG TAC GGT 1058 
Ala Gly Val His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly 
335 340 345 

ATT GCC CTG CGG GCC GGG CAG CAT TGC GCT CAG CCG CTA CTG GCA GAA 1106 
lie Ala Leu Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu 
350 355 360 365 

TTA GGC GTA ACC GGC ACA CTG CGC GCC TCT TTT GCG CCA TAT AAT ACA 1154 
Leu Gly Val Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr 

370 375 380 

AAG AGT GAT GTG GAT GCG CTG GTG AAT GCC GTT GAC CGC GCG CTG GAA 12 02 

Lys Ser Asp Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu 
385 390 395 

TTA TTG GTG GAT TA 1217 
Leu Leu Val Asp 
400 

(2) INFORMATION ZU SEQ ID NO: 2: 

(i) SEQUENZ CHARAKTE R I ST I KA : 
(A) LANGS: 401 Aminosauren 
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(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
1 5 10 15 

Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 



20 



25 30 



Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
35 " 40 45 

Asn val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

Asp Lys Thr He Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 

85 90 95 

Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 110 

He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 

165 170 ' 175 

Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

-Cln-q-1-r tip. Asp Phe Ty r Ala Phe Ser Gly H is Lys Leu Tyr 

210 215 220 

Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 

245 250 255 
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Phe Asp Gly Phe Thr 
260 

Thr Pro Asn Val Ala 
275 

Leu Ala Asp Tyr Asp 
290 

Ala Thr Leu Ala Glu 
305 

Phe Arg Cys Gin Asp 

325 

His His Ser Asp Met 
340 

Arg Ala Gly Gin His 
355 

Thr Gly Thr Leu Arg 
370 

Val Asp Ala Leu Val 
385 

Asp 



Thr Gin Ser Ala Pro Trp 
265 

Gly Val lie Gly Leu Ser 
280 

lie Asn Gin Ala Glu Ser 
295 

Asp Ala Leu Ala Lys Arg 
310 315 

Ser Ser Leu Leu Ala Phe 
330 

Val Thr Leu Leu Ala Glu 
345 

Cys Ala Gin Pro Leu Leu 
360 

Ala Ser Phe Ala Pro Tyr 
375 

Asn Ala Val Asp Arg Ala 
390 395 



Lys Leu Glu Ala Gly 
270 

Ala Ala Leu Glu Trp 
285 

Trp Ser Arg Ser Leu 
300 

Pro Gly Phe Arg Ser 

320 

Asp Phe Ala Gly Val 
335 

Tyr Gly lie Ala Leu 
350 

Ala Glu Leu Gly Val 
365 

Asn Thr Lys Ser Asp 
380 

Leu Glu Leu Leu Val 

400 



(2) INFORMATION ZU SEQ ID NO: 3: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1233 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 
(iii) HYPOTHETI SCH : NEIN 
(iii) ANTISENSE: NEIN 

(vi) URSPRUNLICHE HERKUNFT : 

(A) ORGANISMUS: Escherichia coli 

(B) STAMM: W3110 

<ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 19.. 1233 
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(ix) MERKMALE: 

(A) NAME/ SCHLUSSEL : 5 ' UTR 

(B) LAGE : 1..18 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 

AAAGAGGAGA AATTAACT ATG AAA TTA CCG ATT TAT CTC GAC TAC TCC GCA 51 

Met Lys Leu Pro lie Tyr Leu Asp Tyr Ser Ala 
15 10 

ACC ACG CCG GTG GAC CCG CGT GTT GCC GAG AAA ATG ATG CAG TTT ATG 99 
Thr Thr Pro Val Asp Pro Arg Val Ala Glu Lys Met Met Gin Phe Met 
15 20 25 

ACG ATG GAC GGA ACC TTT GGT AAC CCG GCC TCC CGT TCT CAC CGT TTC 147 
Thr Met Asp Gly Thr Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe 
30 35 40 

GGC TGG CAG GCT GAA GAA GCG GTA GAT ATC GCC CGT AAT CAG ATT GCC 195 
Gly Trp Gin Ala Glu Glu Ala Val Asp lie Ala Arg Asn Gin lie Ala 
45 50 55 

GAT CTG GTC GGC GCT GAT CCG CGT GAA ATC GTC TTT ACC TCT GGT GCA 243 
Asp Leu Val Gly Ala Asp Pro Arg Glu lie Val Phe Thr Ser Gly Ala 
60 65 70 75 

ACC GAA TCT GAC AAC CTG GCG ATC AAA GGT GCA GCC AAC TTT TAT CAG 2 91 

Thr Glu Ser Asp Asn Leu Ala lie Lys Gly Ala Ala Asn Phe Tyr Gin 

80 85 90 

AAA AAA GGC AAG CAC ATC ATC ACC AGC AAA ACC GAA CAC AAA GCG GTA 3 39 

Lys Lys Gly Lys His He He Thr Ser Lys Thr Glu His Lys Ala Val 
95 100 105 

CTG GAT ACC TGC CGT CAG CTG GAG CGC GAA GGT TTT GAA GTC ACC TAC 387 
Leu Asp Thr Cys Arg Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr 
HO 115 120 

CTG GCA CCG CAG CGT AAC GGC ATT ATC GAC CTG AAA GAA CTT GAA GCA 4 35 

Leu Ala Pro Gin Arg Asn Gly He He Asp Leu Lys Glu Leu Glu Ala 
125 130 135 

GCG ATG CGT GAC GAC ACC ATC CTC GTG TCC ATC ATG CAC GTA AAT AAC 4 83 

Ala Met Arg Asp Asp Thr He Leu Val Ser He Met His Val Asn Asn 
140 145 150 155 



531 



GAA ATC GGC GTG GTG CAG GAT ATC GCG GCT ATC GGC GAA ATG TGC CGT 
Glu He Gly Val Val Gin Asp lie Ala Ala He Gly Glu Met Cys Arg 

160 165 170 

GCT CGT GGC ATT ATC TAT CAC GTT GAT GCA ACC CAG AGC GTG GGT AAA 579 
Ala Arg Gly He He Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys 
175 180 185 



BNSOOCIO: <WO 990528SA1> 



WO 99/05285 



7 / 31 



PCT/EP98/04097 



CTG CCT ATC GAC CTG AGC CAG TTG AAA GTT GAC CTG ATG TCT TTC TCC 627 
Leu Pro He Asp Leu Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser 
190 195 200 

GGT CAC AAA ATC TAT GGC CCG AAA GGT ATC GGT GCG CTG TAT GTA CGT 675 
Gly His Lys He Tyr Gly Pro Lys Gly He Gly Ala Leu Tyr Val Arg 
205 210 215 

CGT AAA CCG CGC GTA CGC ATC GAA GCG CAA ATG CAC GGC GGC GGT CAC 723 
Arg Lys Pro Arg Val Arg He Glu Ala Gin Met His Gly Gly Gly His 
220 225 230 235 

GAG CGC GGT ATG CGT TCC GGC ACT CTG CCT GTT CAC CAG ATC GTC GGA 771 
Glu Arg Gly Met Arg Ser Gly Thr Leu Pro Val His Gin He Val Gly 

240 245 250 

ATG GGC GAG GCC TAT CGC ATC GCA AAA GAA GAG ATG GCG ACC GAG ATG 819 
Met Gly Glu Ala Tyr Arg He Ala Lys Glu Glu Met Ala Thr Glu Met 
255 260 265 

GAA CGT CTG CGC GGC CTG CGT AAC CGT CTG TGG AAC GGC ATC AAA GAT 867 
Glu Arg Leu Arg Gly Leu Arg Asn Arg Leu Trp Asn Gly He Lys Asp 
270 275 280 

ATC GAA GAA GTT TAC CTG AAC GGT GAC CTG GAA CAC GGT GCG CCG AAC 915 
He Glu Glu Val Tyr Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn 
285 290 295 

ATT CTC AAC GTC AGC TTC AAC TAC GTT GAA GGT GAG TCG CTG ATT ATG 9 63 

He Leu Asn Val Ser Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met 
300 305 310 315 

GCG CTG AAA GAC CTC GCA GTT TCT TCA GGT TCC GCC TGT ACG TCA GCA 1011 
Ala Leu Lys Asp Leu Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala 

320 325 330 

AGC CTC GAA CCG TCC TAC GTG CTG CGC GCG CTG GGG CTG AAC GAC GAG 1059 
Ser Leu Glu Pro Ser Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu 
335 340 345 

CTG GCA CAT AGC TCT ATC CGT TTC TCT TTA GGT CGT TTT ACT ACT GAA 1107 
Leu Ala His Ser Ser He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu 
350 355 360 

GAA GAG ATC GAC TAC ACC ATC GAG TTA GTT CGT AAA TCC ATC GGT CGT 1155 
Glu Glu He Asp Tyr Thr He Glu Leu Val Arg Lys Ser He Gly Arg 
365 370 375 

CTG CGT GAC CTT TCT CCG CTG TGG GAA ATG TAC AAG CAG GGC GTG GAT 12 03 

Leu Arg Asp Leu Ser Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp 
380 385 390 395 
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CTG AAC AGC ATC GAA TGG GCT CAT CAT TA 12 33 

Leu Asn Ser lie Glu Trp Ala His His 

400 405 

(2) INFORMATION ZU SEQ ID NO: 4: 

(i) SEQUENZ CHARAKTERI ST IKA : 

(A) LANGE: 404 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 

Met Lys Leu Pro He Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp 
1 5 10 15 

Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp Gly Thr 
20 25 30 

Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu 
35 40 45 

Glu Ala Val Asp He Ala Arg Asn Gin He Ala Asp Leu Val Gly Ala 
50 55 60 

Asp Pro Arg Glu lie Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn 
65 70 75 80 

Leu Ala He Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His 

85 90 95 

He He Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg 
100 105 110 

Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg 
115 120 125 

Asn Gly He He Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp 
130 135 140 

Thr He Leu Val Ser He Met His Val Asn Asn Glu He Gly Val Val 
145 150 155 160 

_Gln Asp He Ala Ala He Gly Glu Met Cys Arg Ala Arg Gly He He 

T65 1-7-0 1-7-5 



Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro. He Asp Leu 
180 185 190 

Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys He Tyr 

195 200 205 
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Gly Pro Lys Gly lie Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val 
210 215 220 

Arg He Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly Met Arg 
225 230 235 240 

Ser Gly Thr Leu Pro Val His Gin lie Val Gly Met Gly Glu Ala Tyr 

245 250 255 

Arg He Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly 
260 265 270 

Leu Arg Asn Arg Leu Trp Asn Gly He Lys Asp lie Glu Glu Val Tyr 
275 280 285 

Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn He Leu Asn Val Ser 
290 295 300 

Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met Ala Leu Lys Asp Leu 
305 310 315 320 

Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser 

325 330 335 

Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser 
340 345 350 

He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu He Asp Tyr 
355 360 365 

Thr He Glu Leu Val Arg Lys Ser He Gly Arg Leu Arg Asp Leu Ser 
370 375 380 

Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser He Glu 
385 390 395 400 

Trp Ala His His 



(2) INFORMATION ZU SEQ ID NO : 5: 

(i) SEQUENZ CKARAKTERI STIKA : 

(A) LANGE: 3794 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: ringformig 

(ii) ART DES MOLEKULS : DNS (genomisch) 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 
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(vii) UNMITTELBARE HERKUNFT: 
(B) CL.ON: pHSibioSl 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 601. .1806 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: 

GACGTCTGTG TGGAATTGTG AGCGGATAAC AATTTCACAC AGGGCCCTCG GACACCGAGG 60 

AGAATGTCAA GAGGCGAACA CACAACGTCT TGGAGCGCCA GAGGAGGAAC GAGCTAAAAC 12 0 

GGAGCTTTTT TGCCCTGCGT GACCAGATCC CGGAGTTGGA AAACAATGAA AAGGCCCCCA 180 

AGGTAGTTAT CCTTAAAAAA GCCACAGCAT ACATCCTGTC CGTCCAAGCA GAGGAGCAAA 24 0 

AGCTCATTTC TGAAGAGGAC TTGTTGCGGA AACGACGAGA ACAGTTGAAA CACAAACTTG 3 00 

AACAGCTACG GAACTCTTGT GCGTAAGGAA AAGTAAGGAA AACGATTCCT TCTAACAGAA 3 60 

ATGTCCTGAG CAATCACCTA TGAACTGTCG ACTCGAGATA GCATTTTTAT CCATAAGATT 420 

AGCCGATCCT AAGGTTTACA ATTGTGAGCG CTCACAATTA TGATAGATTC AATTGTGAGC 4 80 

GGATAACAAT TTCACACACG CTAGCGGTAC CGGGCCCCCC CTCGAGGTCG ACGGTATCGA 540 

TAAGCTTGAT ATCGAATTCC TGCAGCCCGG GGGATCCCAT GGTACGCGTC GAG GAGTAC C 600 

ATG AAC GTT TTT AAT CCC GCG CAG TTT CGC GCC CAG TTT CCC GCA CTA 64 8 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
1 5 10 15 

CAG GAT GCG GGC GTC TAT CTC GAC AGC GCC GCG ACC GCG CTT AAA CCT 
Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 

GAA GCC GTG GTT GAA GCC ACC CAA CAG TTT TAC AGT CTG AGC GCC GGA 7 44 

Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
35 40 45 

AAC GTC CAT CGC AGC CAG TTT GCC GAA GCC CAA CGC CTG ACC GCG CGT 792 
Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

TAT GAA GCT GCA CGA GAG AAA GTG GCG CAA TTA CTG AAT GCA CCG GAT 
Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 

65 70 75 80 

GAT AAA ACT ATC GTC TGG ACG CGC GGC ACC ACT GAA TCC ATC AAC ATG 8 88 

Asp Lys Thr lie Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 

85 90 95 



696 



840 
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GTG GCA CAA TGC TAT GCG CGT CCG CGT CTG CAA CCG GGC GAT GAG ATT 936 
Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu lie 
100 105 110 

ATT GTC AGC GTG GCA GAA CAC CAC GCC AAC CTC GTC CCC TGG CTG ATG 9 84 

He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

GTC GCC CAA CAA ACT GGA GCC AAA GTG GTG AAA TTG CCG CTT AAT GCG 1032 
Val Ala Gin Gin Thr Gly Ala Lys Val val Lys Leu Pro Leu Asn Ala 
130 135 140 

CAG CGA CTG CCG GAT GTC GAT TTG TTG CCA GAA CTG ATT ACT CCC CGT 1080 
Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

AGT CGG ATT CTG GCG TTG GGT CAG ATG TCG AAC GTT ACT GGC GGT TGC 112 8 

Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 

165 170 175 

CCG GAT CTG GCG CGA GCG ATT ACC TTT GCT CAT TCA GCC GGG ATG GTG 117 6 

Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

GTG ATG GTT GAT GGT GCT CAG GGG GCA GTG CAT TTC CCC GCG GAT GTT 12 24 

Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
!95 200 205 

CAG CAA CTG GAT ATT GAT TTC TAT GCT TTT TCA GGT CAC AAA CTG TAT 12 7 2 

Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

GGC CCG ACA GGT ATC GGC GTG CTG TAT GGT AAA TCA GAA CTG CTG GAG 13 2 0 

Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

GCG ATG TCG CCC TGG CTG GGC GGC GGC AAA ATG GTT CAC GAA GTG AGT 13 6 8 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 

245 250 255 

TTT GAC GGC TTC ACG ACT CAA TCT GCG CCG TGG AAA CTG GAA GCT GGA 14 16 

Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

ACG CCA AAT GTC GCT GGT GTC ATA GGA TTA AGC GCG GCG CTG GAA TGG 14 64 

Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 

CTG GCA GAT TAC GAT ATC AAC CAG GCC GAA AGC TGG AGC CGT AGC TTA 1512 
Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 
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GCA ACG CTG GCG GAA GAT GCG CTG GCG AAA CGT CCC GGC TTT CGT TCA 1560 
Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 

TTC CGC TGC CAG GAT TCC AGC CTG CTG GCC TTT GAT TTT GCT GGC GTT 16 08 

Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 

325 330 335 

CAT CAT AGC GAT ATG GTG ACG CTG CTG GCG GAG TAC GGT ATT GCC CTG 16 56 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly lie Ala Leu 
340 345 350 

CGG GCC GGG CAG CAT TGC GCT CAG CCG CTA CTG GCA GAA TTA GGC GTA 1704 
Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 

ACC GGC ACA CTG CGC GCC TCT TTT GCG CCA TAT AAT ACA AAG AGT GAT 17 52 

Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

GTG GAT GCG CTG GTG AAT GCC GTT GAC CGC GCG CTG GAA TTA TTG GTG 1800 
Val Asp Ala Leu Val Asn Ala val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 

GAT TAAACGCGTG CTAGAGGCAT CAAATAAAAC GAAAGGCTCA GTCGAAAGAC 1853 
Asp 



TGGGCCTTTC 


GTTTTATCTG 


TTGTTTGTCG 


GTGAACGCTC 


TCCTGAGTAG 


GACAAATCCG 


1913 


CCGCCCTAGA 


CCTAGGGGAT 


ATATTCCGCT 


TCCTCGCTCA 


CTGACTCGCT 


ACGCTCGGTC 


1973 


GTTCGACTGC 


GGCGAGCGGA 


AATGGCTTAC 


GAACGGGGCG 


GAGATTTCCT 


GGAAGATGCC 


2033 


AGGAAGATAC 


TTAACAGGGA 


AG TG AG AG GG 


CCGCGGCAAA 


GCCGTTTTTC 


CATAGGCTCC 


2093 


GCCCCCCTGA 


CAAGCATCAC 


GAAATCTGAC 


GCTCAAATCA 


GTGGTGGCGA 


AACCCGACAG 


2153 


GACTATAAAG 


ATACCAGGCG 


TTTCCCCCTG 


GCGGCTCCCT 


CGTGCGCTCT 


CCTGTTCCTG 


2213 


CCTTTCGGTT 


TACCGGTGTC 


ATTCCGCTGT 


TATGGCCGCG 


TTTGTCTCAT 


TCCACGCCTG 


2273 


ACACTCAGTT 


CCGGGTAGGC 


AGTTCGCTCC 


AAGCTGGACT 


GTATGCACGA 


ACCCCCCGTT 


2333 


CAGTCCGACC 


GCTGCGCCTT 


ATCCGGTAAC 


TATCGTCTTG 


AGTCCAACCC 


GGAAAGACAT 


2393 


GCAAAAGCAC 


CACTGGCAGC 


AGCCACTGGT 


AATTGATTTA 


GAGGAGTTAG 


TCTTGAAGTC 


2453 


ATGCGCCGGT 


T AAGG CT AAA 


CTGAAAGGAC 


AAGTTTTGGT 


GACTGCGCTC 


CTCCAAGCCA 


2 513 


GTTACCTCGG 


TTCAAAGAGT 


TGGTAGCTCA 


GAGAACCTTC 


GAAAAACCGC 


CCTGCAAGGC 


2573 


GGTTTTTTCG 


TTTTCAGAGC 


AAGAGATTAC 


GCGCAGACCA 


AAACGATCTC 


AAGAAGATCA 


2633 


TCTTATTAAT 


CAGATAAAAT 


ATTTCTAGAT 


TTCAGTGCAA 


TTTATCTCTT 


CAAATGTAGC 


2693 
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ACCTGAAGTC AGCCCCATAC GATATAAGTT GTTACTAGTG CTTGGATTCT C AC C AATAAA 27 53 

AAACGCCCGG CGGCAACCGA GCGTTCTGAA C AAATC C AG A TGGAGTTCTG AGGTCATTAC 2813 

TGGATCTATC AACAGGAGTC CAAGCGAGCT CTCGAACCCC AGAGTCCCGC TCAGAAGAAC 287 3 

TCGTCAAGAA GGCGATAGAA GGCGATGCGC TGCGAATCGG GAGCGGCGAT ACCGTAAAGC 29 33 

ACGAGGAAGC GGTCAGCCCA TTCGCCGCCA AGCTCTTCAG CAATATCACG GGTAGCCAAC 29 93 

GCTATGTCCT GATAGCGGTC CGCCACACCC AGCCGGCCAC AGTCGATGAA TCCAGAAAAG 3 0 53 

CGGCCATTTT CCACCATGAT ATTCGGCAAG CAGGCATCGC CATGGGTCAC GACGAGATCC 3113 

TCGCCGTCGG GCATGCGCGC CTTGAGCCTG GCGAACAGTT CGGCTGGCGC GAGCCCCTGA 317 3 

TGCTCTTCGT CCAGATCATC CTGATCGACA AGACCGGCTT CCATCCGAGT ACGTGCTCGC 3233 

TCGATGCGAT GTTTCGCTTG GTGGTCGAAT GGGCAGGTAG CCGGATCAAG CGTATGCAGC 3293 

CGCCGCATTG CATCAGCCAT GATGGATACT TTCTCGGCAG GAGCAAGGTG AGATGACAGG 3 3 53 

AGATCCTGCC CCGGCACTTC GCCCAATAGC AGCCAGTCCC TTCCCGCTTC AGTGACAACG 3413 

TCGAGCACAG CTGCGCAAGG AACGCCCGTC GTGGCCAGCC ACGATAGCCG CGCTGCCTCG 34 73 

TCCTGCAGTT CATTCAGGGC ACCGGACAGG TCGGTCTTGA CAAAAAGAAC CGGGCGCCCC 3 533 

TGCGCTGACA GCCGGAACAC GGCGGCATCA GAGCAGCCGA TTGTCTGTTG TGCCCAGTCA 3 593 

TAGC CGAAT A GCCTCTCCAC CCAAGCGGCC GGAGAACCTG CGTGCAATCC ATCTTGTTCA 36 53 

ATCATGCGAA ACGATCCTCA TCCTGTCTCT TGATCAGATC TTGATCCCCT GCGCCATCAG 3713 

ATCCTTGGCG GCAAGAAAGC CATCCAGTTT ACTTTGCAGG GCTTCCCAAC CTTACCAGAG 377 3 

GGCGCCCCAG CTGGCAATTC C 37 94 
(2) INFORMATION ZU SEQ ID NO : 6 : 

(i) SEQUENZ CHARAKTERI ST I KA : 

(A) LANGE: 401 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZ3ESCHREIBUNG: SEQ ID NO: 6: 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
15 10 15 

Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 
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Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
35 40 45 

Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

Asp Lys Thr lie Val Trp Thr Arg Gly Thr Thr Glu Ser lie Asn Met 

85 90 95 

Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 HO 

He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 

165 170 175 

Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

Val Met val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 . _ 230 235 240 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 

245 250 255 

Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 

2 /7_5 280 2 85 



Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 

Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 



310 315 320 
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Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 

325 330 335 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly lie Ala Leu 
340 345 350 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 

Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 

Asp 

(2) INFORMATION ZU SEQ ID NO : 7: 

(i) SEQUENZ CHARAKTERI STIKA : 

(A) LANGE: 3810 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANG FORM : Einzel 

(D) TOPOLOGIE: ringformig 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(iii) HYPOTHETISCH : NEIN 

(iii) ANTI SENSE: NEIN 

(vii) UNMI TTELBARE HERKUNFT: 
(B) CLON: pHSlbioS2 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 608. . 1822 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 7: 

GACGTCTGTG TGGAATTGTG AGCGGATAAC AATTTCACAC AGGGCCCTCG GACACCGAGG 60 

AGAATGTCAA GAGGCGAACA CACAACGTCT TGGAGCGCCA GAGGAGGAAC GAGCTAAAAC 120 

GG AG CTTTTT TGCCCTGCGT GACCAGATCC CGGAGTTGGA AAACAATGAA AAGGCCCCCA 180 

AGGTAGTTAT CCTTAAAAAA GCCACAGCAT ACATCCTGTC CGTCCAAGCA GAGGAGCAAA 2 40 

AGCTCATTTC TGAAGAGGAC TTGTTGCGGA AACGACGAGA ACAGTTGAAA CACAAACTTG 3 00 

AACAGCTACG GAACTCTTGT GCGTAAGGAA AAGTAAGGAA AACGATTCCT TCTAACAGAA 360 

ATGTCCTGAG CAATCACCTA TGAACTGTCG ACTCGAGATA GCATTTTTAT CCATAAGATT 4 20 
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AGCCGATCCT AAGGTTTACA ATTGTGAGCG CTCACAATTA TGATAGATTC AATTGTGAGC 4 80 

GGATAACAAT TTC AC AC AC G CTAGCGGTAC CGGGCCCCCC CTCGAGGTCG ACGGTATCGA 54 0 

TAAGCTTGAT ATCGAATTCC TGCAGCCCGG GGGATC CC AT GGTACGCGTA AAGAGGAGAA 6 00 

ATTAACT ATG AAA TTA CCG ATT TAT CTC GAC TAC TCC GCA ACC ACG CCG 6 49 

Met Lys Leu Pro lie Tyr Leu Asp Tyr Ser Ala Thr Thr Pro 
15 10 

GTG GAC CCG CGT GTT GCC GAG AAA ATG ATG CAG TTT ATG ACG ATG GAC 6 97 

Val Asp Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp 
15 20 25 30 

GGA ACC TTT GGT AAC CCG GCC TCC CGT TCT CAC CGT TTC GGC TGG CAG 7 45 

Gly Thr Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin 

35 40 45 

GCT GAA GAA GCG GTA GAT ATC GCC CGT AAT CAG ATT GCC GAT CTG GTC 7 93 

Ala Glu Glu Ala Val Asp lie Ala Arg Asn Gin lie Ala Asp Leu Val 
50 55 60 

GGC GCT GAT CCG CGT GAA ATC GTC TTT ACC TCT GGT GCA ACC GAA TCT 841 
Gly Ala Asp Pro Arg Glu lie Val Phe Thr Ser Gly Ala Thr Glu Ser 
65 70 75 

GAC AAC CTG GCG ATC AAA GGT GCA GCC AAC TTT TAT CAG AAA AAA GGC 8 89 

Asp Asn Leu Ala lie Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly 
80 85 90 

AAG CAC ATC ATC ACC AGC AAA ACC GAA CAC AAA GCG GTA CTG GAT ACC 9 37 

Lys His lie lie Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr 
95 100 105 110 

TGC CGT CAG CTG GAG CGC GAA GGT TTT GAA GTC ACC TAC CTG GCA CCG 9 85 

Cys Arg Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro 

115 120 125 

CAG CGT AAC GGC ATT ATC GAC CTG AAA GAA CTT GAA GCA GCG ATG CGT 1033 
Gin Arg Asn Gly lie lie Asp Leu Lys Glu Leu Glu Ala Ala Met Arg 
130 135 140 

GAC GAC ACC ATC CTC GTG TCC ATC ATG CAC GTA AAT AAC GAA ATC GGC 1081 
Asp Asp Thr lie Leu Val Ser lie Met His Val Asn Asn Glu lie Gly 
145 150 155 

GTG" GTG CAG — GAT~~XTC~GCG ~GCT~ATC"~GGC ~GAft~ ~ATG~ TGC~ CGT~GCT— GGT-GGG 1-1-2.9- 

Val Val Gin Asp He Ala Ala He Gly Glu Met Cys Arg Ala Arg Gly 
160 165 170 

ATT ATC TAT CAC GTT GAT GCA ACC CAG AGC GTG GGT AAA CTG CCT ATC 1177 
He He Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro He 
175 180 185 190 
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GAC CTG AGC CAG TTG AAA GTT GAC CTG ATG TCT TTC TCC GGT CAC AAA 122 5 

Asp Leu Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys 

195 200 205 

ATC TAT GGC CCG AAA GGT ATC GGT GCG CTG TAT GTA CGT CGT AAA CCG 1273 
lie Tyr Gly Pro Lys Gly He Gly Ala Leu Tyr Val Arg Arg Lys Pro 
210 215 220 

CGC GTA CGC ATC GAA GCG CAA ATG CAC GGC GGC GGT CAC GAG CGC GGT 1321 
Arg Val Arg He Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly 
225 230 235 

ATG CGT TCC GGC ACT CTG CCT GTT CAC CAG ATC GTC GGA ATG GGC GAG 1369 
Met Arg Ser Gly Thr Leu Pro Val His Gin He Val Gly Met Gly Glu 
240 245 250 

GCC TAT CGC ATC GCA AAA GAA GAG ATG GCG ACC GAG ATG GAA CGT CTG 1417 
Ala Tyr Arg He Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu 
255 260 265 270 

CGC GGC CTG CGT AAC CGT CTG TGG AAC GGC ATC AAA GAT ATC GAA GAA 14 65 

Arg Gly Leu Arg Asn Arg Leu Trp Asn Gly He Lys Asp He Glu Glu 

275 280 285 

GTT TAC CTG AAC GGT GAC CTG GAA CAC GGT GCG CCG AAC ATT CTC AAC 1513 
Val Tyr Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn He Leu Asn 
290 295 300 

GTC AGC TTC AAC TAC GTT GAA GGT GAG TCG CTG ATT ATG GCG CTG AAA 1561 
Val Ser Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met Ala Leu Lys 
305 310 315 

GAC CTC GCA GTT TCT TCA GGT TCC GCC TGT ACG TCA GCA AGC CTC GAA 1609 
Asp Leu Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu 
320 325 330 

CCG TCC TAC GTG CTG CGC GCG CTG GGG CTG AAC GAC GAG CTG GCA CAT 1657 
Pro Ser Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His 
335 340 345 350 

AGC TCT ATC CGT TTC TCT TTA GGT CGT TTT ACT ACT GAA GAA GAG ATC 17 05 

Ser Ser He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu lie 

355 360 365 

GAC TAC ACC ATC GAG TTA GTT CGT AAA TCC ATC GGT CGT CTG CGT GAC 17 53 

Asp Tyr Thr He Glu Leu Val Arg Lys Ser He Gly Arg Leu Arg Asp 
370 375 380 

CTT TCT CCG CTG TGG GAA ATG TAC AAG CAG GGC GTG GAT CTG AAC AGC 1801 
Leu Ser Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser 
385 390 395 
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ATC GAA TGG GCT CAT CAT TAAACGCGTG CTAGAGGCAT CAAATAAAAC 1849 
lie Glu Trp Ala His His 

400 405 



GAAAGGCTCA 


GTCGAAAGAC 


tgggcctttc 


GTTTTATCTG 


TTGTTTGTCG 


GTGAACGCTC 


1909 


TCCTGAGTAG 


GACAAATCCG 


ccgccctaga 


CCTAGGGGAT 


ATATTCCGCT 


TCCTCGCTCA 


1969 


CTGACTCGCT 


ACGCTCGGTC 


GTTCGACTGC 


GGCGAGCGGA 


AATGGCTTAC 


GAACGGGGCG 


2029 


GAGATTTCCT 


GGAAGATGCC 


AG G AAG AT AC 


TTAACAGGGA 


AGTGAGAGGG 


CCGCGGCAAA 


2089 


GCCGTTTTTC 


CATAGGCTCC 


GCCCCCCTGA 


CAAGCATCAC 


GAAATCTGAC 


GCTCAAATCA 


2149 


GTGGTGGCGA 


AACCCGACAG 


GACTATAAAG 


ATACCAGGCG 


TTTCCCCCTG 


GCGGCTCCCT 


2209 


CGTGCGCTCT 


CCTGTTCCTG 


CCTTTCGGTT 


TACCGGTGTC 


ATTCCGCTGT 


TATGGCCGCG 


2269 


TTTGTCTCAT 


TCCACGCCTG 


AC AC TCAGTT 


CCGGGTAGGC 


AGTTCGCTCC 


AAG C TGG ACT 


2329 


GTATGCACGA 


ACCCCCCGTT 


CAGTCCGACC 


GCTGCGCCTT 


ATCCGGTAAC 


TATCGTCTTG 


2389 


AGTCCAACCC 


G G AAAGAC AT 


GCAAAAGCAC 


CACTGGCAGC 


AGCCACTGGT 


AATTGATTTA 


24 49 


GAGGAGTTAG 


TCTTGAAGTC 


ATGCGCCGGT 


TAAGGCTAAA 


CTGAAAGGAC 


AAGTTTTGGT 


2509 


GACTGCGCTC 


CTCCAAGCCA 


GTTACCTCGG 


TTCAAAGAGT 


TGGTAGCTCA 


GAGAACCTTC 


2569 


GAAAAACCGC 


CCTGCAAGGC 


GGTTTTTTCG 


TTTTCAGAGC 


AAGAGATTAC 


GCGCAGACCA 


2629 


AAACGATCTC 


AAGAAGATCA 


TCTTATTAAT 


CAGATAAAAT 


ATTTC TAG AT 


TTCAGTGCAA 


2689 


TTTATCTCTT 


CAAATGTAGC 


ACCTGAAGTC 


AGCCCCATAC 


GATATAAGTT 


GTTACTAGTG 


2749 


CTTGGATTCT 


CACCAATAAA 


AAACGCCCGG 


CGGCAACCGA 


GCGTTCTGAA 


CAAATCCAGA 


2809 


TGGAGTTCTG 


AGGTCATTAC 


TGGATCTATC 


AACAGGAGTC 


CAAGCGAGCT 


CTCGAACCCC 


2869 


AGAGTCCCGC 


TCAGAAGAAC 


TCGTCAAGAA 


GGCGATAGAA 


GGCGATGCGC 


TGCGAATCGG 


2929 


GAGCGGCGAT 


"accgtaaagc 


AC G AGGAAGC 


GGTCAGCCCA 


TTCGCCGCCA 


AGCTCTTCAG 


2989 


CAATATCACG 


GGTAGCCAAC 


GCTATGTCCT 


GATAGCGGTC 


CGCCACACCC 


AGCCGGCCAC 


3049 


AGTCGATGAA 


TCCAGAAAAG 


CGGCCATTTT 


CCACCATGAT 


ATTCGGCAAG 


CAGGCATCGC 


3109 


CATGGGTCAC 


GACGAGATCC 


TCGCCGTCGG 


GCATGCGCGC 


CTTGAGCCTG 


GCGAACAGTT 


3169 


CGGCTGGCGC 


GAGCCCCTGA 


TGCTCTTCGT 


CCAGATCATC 


CTGATCGACA 


AGACCGGCTT 


3229 


CCATCCGAGT 


acgtgctcgc 


TCGATGCGAT 


GTTTCGCTTG 


GTGGTCGAAT 


GGGCAGGTAG 


3 2 89 


CCGGATCAAG 


cgtatgcagc 


CGCCGCATTG 


CATCAGCCAT 


GATGGATACT 


TTCTCGGCAG 


3349 


GAGCAAGGTG 


agatgacagg 


AGATCCTGCC 


CCGGCACTTC 


GCCCAATAGC 


AGCCAGTCCC 


3409 


TTCCCGCTTC 


agtgacaacg 


TCGAGCACAG 


CTGCGCAAGG 


AACGCCCGTC 


GTGGCCAGCC 


3469 
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ACGATAGCCG CGCTGCCTCG TCCTGCAGTT CATTCAGGGC ACCGGACAGG TCGGTCTTGA 3529 

CAAAAAGAAC CGGGCGCCCC TGCGCTGACA GCCGGAACAC GGCGGCATCA GAGCAGCCGA 3 589 

TTGTCTGTTG TGCCCAGTCA TAGCCGAATA GCCTCTCCAC CCAAGCGGCC GGAGAACCTG 364 9 

CGTGCAATCC ATCTTGTTCA ATCATGCGAA ACGATCCTCA TCCTGTCTCT TGATCAGATC 3709 

TTGATCCCCT GCGCCATCAG ATCCTTGGCG GCAAGAAAGC CATCCAGTTT ACTTTGCAGG 3769 

GCTTCCCAAC CTTACCAGAG GGCGCCCCAG CTGGCAATTC C 3 810 
(2) INFORMATION ZU SEQ ID NO: 8: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 404 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 

Met Lys Leu Pro lie Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp 
15 10 15 

Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp Gly Thr 
20 25 30 

Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu 
35 40 45 

Glu Ala Val Asp lie Ala Arg Asn Gin lie Ala Asp Leu Val Gly Ala 
50 55 60 

Asp Pro Arg Glu lie Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn 
65 70 75 80 

Leu Ala lie Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His 

85 90 95 

lie lie Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg 
100 105 110 

Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg 
115 120 125 

Asn Gly lie lie Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp 
130 135 140 

Thr lie Leu Val Ser lie Met His Val Asn Asn Glu lie Gly Val Val 
145 150 155 160 

Gin Asp lie Ala Ala lie Gly Glu Met Cys Arg Ala Arg Gly lie lie 

165 170 175 
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Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro lie Asp Leu 
180 135 ISO 

Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys He Tyr 
195 200 205 

Gly Pro Lys Gly He Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val 
210 215 220 

Arg He Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly Met Arg 
225 230 235 240 

Ser Gly Thr Leu Pro Val His Gin lie Val Gly Met Gly Glu Ala Tyr 
245 250 255 

Arg He Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly 
260 265 270 

Leu Arg Asn Arg Leu Trp Asn Gly He Lys Asp He Glu Glu Val Tyr 
275 280 285 

Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn He Leu Asn Val Ser 
290 295 300 

Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met Ala Leu Lys Asp Leu 
305 310 315 320 

Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser 

325 330 335 

Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser 
340 345 350 

He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu He Asp Tyr 
355 360 365 

Thr He Glu Leu Val Arg Lys Ser He Gly Arg Leu Arg Asp Leu Ser 
370 375 380 

Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser He Glu 
385 390 395 400 

Trp Ala His His 



(2) INFORMATION ZU SEQ ID NO: 9: 

(i) SEQUENZ CHARAKTERI ST I KA : 

(A) LANGE: 34 6 5 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: ringformig 

(ii) ART DES MOLEKULS: DNS (genomisch) 
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(iii) HYPOTHETISCH : NEIN 

(iii) ANTISENSE: NEIN 

(vii) UNMI TTELBARE HERKUNFT: 
(B) CLON: pHS2bioSl 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 272. .1477 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 

GACGTCTAAG AAACCATTAT TATCATGACA TTAACCTATA AAAATAGGCG TATCACGAGG 60 

CCCTTTCGTC TTCACCTCGA GTCCCTATCA GTGATAGAGA TTGACATCCC TATCAGTGAT 120 

AGAGATACTG AGCACATCAG CAGGACGCAC TGACCGAATT CATTAAAGAG GAGAAAGGTA 180 

CCGGGCCCCC CCTCGAGGTC GACGGTATCG ATAAGCTTGA TATCGAATTC CTGCAGCCCG 24 0 

GGGGATCCCA TGGTACGCGT CGAGGAGTAC C ATG AAC GTT TTT AAT CCC GCG 292 

Met Asn Val Phe Asn Pro Ala 
1 5 

CAG TTT CGC GCC CAG TTT CCC GCA CTA CAG GAT GCG GGC GTC TAT CTC 3 40 

Gin Phe Arg Ala Gin Phe Pro Ala Leu Gin Asp Ala Gly val Tyr Leu 
10 15 20 

GAC AGC GCC GCG ACC GCG CTT AAA CCT GAA GCC GTG GTT GAA GCC ACC 3 88 

Asp Ser Ala Ala Thr Ala Leu Lys Pro Glu Ala Val Val Glu Ala Thr 
25 30 35 

CAA CAG TTT TAC AGT CTG AGC GCC GGA AAC GTC CAT CGC AGC CAG TTT 4 36 

Gin Gin Phe Tyr Ser Leu Ser Ala Gly Asn Val His Arg Ser Gin Phe 
40 45 50 55 

GCC GAA GCC CAA CGC CTG ACC GCG CGT TAT GAA GCT GCA CGA GAG AAA 4 84 

Ala Glu Ala Gin Arg Leu Thr Ala Arg Tyr Glu Ala Ala Arg Glu Lys 

60 65 70 

GTG GCG CAA TTA CTG AAT GCA CCG GAT GAT AAA ACT ATC GTC TGG ACG 532 
Val Ala Gin Leu Leu Asn Ala Pro Asp Asp Lys Thr lie Val Trp Thr 
75 80 85 

CGC GGC ACC ACT GAA TCC ATC AAC ATG GTG GCA CAA TGC TAT GCG CGT 5 80 

Arg Gly Thr Thr Glu Ser lie Asn Met Val Ala Gin Cys Tyr Ala Arg 
90 95 100 

CCG CGT CTG CAA CCG GGC GAT GAG ATT ATT GTC AGC GTG GCA GAA CAC 628 
Pro Arg Leu Gin Pro Gly Asp Glu lie lie Val Ser Val Ala Glu His 
105 110 115 
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CAC GCC AAC CTC GTC CCC TGG CTG ATG GTC GCC CAA CAA ACT GGA GCC 676 
His Ala Asn Leu Val Pro Trp Leu Met Val Ala Gin Gin Thr Gly Ala 
120 125 130 135 

AAA GTG GTG AAA TTG CCG CTT AAT GCG CAG CGA CTG CCG GAT GTC GAT 7 24 

Lys Val Val Lys Leu Pro Leu Asn Ala Gin Arg Leu Pro Asp Val Asp 
140 145 150 

TTG TTG CCA GAA CTG ATT ACT CCC CGT AGT CGG ATT CTG GCG TTG GGT 772 
Leu Leu Pro Glu Leu He Thr Pro Arg Ser Arg He Leu Ala Leu Gly 
155 160 165 

CAG ATG TCG AAC GTT ACT GGC GGT TGC CCG GAT CTG GCG CGA GCG ATT 82 0 

Gin Met Ser Asn Val Thr Gly Gly Cys Pro Asp Leu Ala Arg Ala He 
170 175 180 

ACC TTT GCT CAT TCA GCC GGG ATG GTG GTG ATG GTT GAT GGT GCT CAG 868 
Thr Phe Ala His Ser Ala Gly Met Val Val Met Val Asp Gly Ala Gin 
185 190 195 

GGG GCA GTG CAT TTC CCC GCG GAT GTT CAG CAA CTG GAT ATT GAT TTC 916 
Gly Ala Val His Phe Pro Ala Asp Val Gin Gin Leu Asp He Asp Phe 
200 205 210 215 

TAT GCT TTT TCA GGT CAC AAA CTG TAT GGC CCG AC A GGT ATC GGC GTG 9 64 

Tyr Ala Phe Ser Gly His Lys Leu Tyr Gly Pro Thr Gly He Gly Val 
220 225 230 

CTG TAT GGT AAA TCA GAA CTG CTG GAG GCG ATG TCG CCC TGG CTG GGC 1012 
Leu Tyr Gly Lys Ser Glu Leu Leu Glu Ala Met Ser Pro Trp Leu Gly 
235 240 245 

GGC GGC AAA ATG GTT CAC GAA GTG AGT TTT GAC GGC TTC ACG ACT CAA 1060 
Gly Gly Lys Met Val His Glu Val Ser Phe Asp Gly Phe Thr Thr Gin 
250 255 260 

TCT GCG CCG TGG AAA CTG GAA GCT GGA ACG CCA AAT GTC GCT GGT GTC 1108 
Ser Ala Pro Trp Lys Leu Glu Ala Gly Thr Pro "Asn Val Ala Gly Val 
265 270 275 

ATA GGA TTA AGC GCG GCG CTG GAA TGG CTG GCA GAT TAC GAT ATC AAC 1156 
He Gly Leu Ser Ala Ala Leu Glu Trp Leu Ala Asp Tyr Asp He Asn 
280 285 290 295 

CAG GCC GAA AGC TGG AGC CGT AGC TTA GCA ACG CTG GCG GAA GAT GCG 12 04 

— Gin™ Ala-G lu- Ser-Trp-Se r— Arg- -Se -r— Leu- Al a— Thr_Leu .._ Al a^ G l.u_ Asp_ Al a 

300 305 310 

CTG GCG AAA CGT CCC GGC TTT CGT TCA TTC CGC TGC CAG GAT TCC AGC 12 52 

Leu Ala Lys Arg Pro Gly Phe Arg Ser Phe Arg Cys Gin Asp Ser Ser 
315 320 325 
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CTG CTG GCC TTT GAT TTT GCT GGC GTT CAT CAT AGC GAT ATG GTG ACG 13 00 

Leu Leu Ala Phe Asp Phe Ala Gly Val His His Ser Asp Met Val Thr 

330 335 340 

CTG CTG GCG GAG TAC GGT ATT GCC CTG CGG GCC GGG CAG CAT TGC GCT 1348 
Leu Leu Ala Glu Tyr Gly lie Ala Leu Arg Ala Gly Gin His Cys Ala 
345 350 355 

CAG CCG CTA CTG GCA GAA TTA GGC GTA ACC GGC ACA CTG CGC GCC TCT 1396 
Gin Pro Leu Leu Ala Glu Leu Gly Val Thr Gly Thr Leu Arg Ala Ser 
360 365 370 375 

TTT GCG CCA TAT AAT ACA AAG AGT GAT GTG GAT GCG CTG GTG AAT GCC 14 44 

Phe Ala Pro Tyr Asn Thr Lys Ser Asp Val Asp Ala Leu Val Asn Ala 

380 385 390 

GTT GAC CGC GCG CTG GAA TTA TTG GTG GAT TAAACGCGTG CTAGAGGCAT 1494 
Val Asp Arg Ala Leu Glu Leu Leu Val Asp 
395 400 

CAAATAAAAC GAAAGGCTCA GTCGAAAGAC TGGGCCTTTC GTTTTATCTG TTGTTTGTCG 15 54 

GTGAACGCTC TCCTGAGTAG GACAAATCCG CCGCCCTAGA CCTAGGGGAT ATATTCCGCT 1614 

TCCTCGCTCA CTGACTCGCT ACGCTCGGTC GTTCGACTGC GGCGAGCGGA AATGG CTTAC 1674 

GAACGGGGCG G AG ATTTCC T GGAAGATGCC AG G AAG AT AC TTAACAGGGA AGTGAGAGGG 17 34 

CCGCGGCAAA GCCGTTTTTC CATAGGCTCC GCCCCCCTGA CAAGCATCAC GAAATCTGAC 1794 

GCTCAAATCA GTGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG 1854 

GCGGCTCCCT CGTGCGCTCT CCTGTTCCTG CCTTTCGGTT TACCGGTGTC ATTCCGCTGT 1914 

TATGGCCGCG TTTGTCTCAT TCCACGCCTG ACACTCAGTT CCGGGTAGGC AGTTCGCTCC 19 74 

AAGC TGGACT GTATGCACGA ACCCCCCGTT CAGTCCGACC GCTGCGCCTT ATCCGGTAAC 2034 

TATCGTCTTG AGTCCAACCC GGAAAGACAT GCAAAAGCAC CACTGGCAGC AGCCACTGGT 2094 

AATTGATTTA GAGGAGTTAG TCTTGAAGTC ATGCGCCGGT TAAGGCTAAA CTGAAAGGAC 2154 

AAGTTTTGGT GACTGCGCTC CTCCAAGCCA GTTACCTCGG TTCAAAGAGT TGGTAGCTCA 2214 

GAGAACCTTC GAAAAACCGC CCTGCAAGGC GGTTTTTTCG TTTTCAGAGC AAGAGATTAC 2274 

GCGCAGACCA AAACGATCTC AAG AAG AT C A TC TT ATT AAT CAGATAAAAT ATTTCTAGAT 23 34 

TTCAGTGCAA TTTATCTCTT CAAATGTAGC ACCTGAAGTC AGCCCCATAC GATATAAGTT 2394 

GTTACTAGTG CTTGGATTCT CACCAATAAA AAACGCCCGG CGGCAACCGA GCGTTCTGAA 24 54 

CAAATCCAGA TGGAGTTCTG AGGTCATTAC TGGATCTATC AACAGGAGTC CAAGCGAGCT 2514 

CTCGAACCCC AGAGTCCCGC TCAGAAGAAC TCGTCAAGAA GGCGATAGAA GGCGATGCGC 2574 
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TGCGAATCGG GAGCGGCGAT ACCGTAAAGC ACGAGGAAGC GGTCAGCCCA TTCGCCGCCA 2634 

AGCTCTTCAG CAATATCACG GGTAGCCAAC GCTATGTCCT GATAGCGGTC CGCCACACCC 2694 

AGCCGGCCAC AGTCGATGAA TCCAGAAAAG CGGCCATTTT CCACCATGAT ATTCGGCAAG 27 54 

CAGGCATCGC CATGGGTCAC GACGAGATCC TCGCCGTCGG GCATGCGCGC CTTGAGCCTG 2 814 

GCGAACAGTT CGGCTGGCGC GAGCCCCTGA TGCTCTTCGT CCAGATCATC CTGATCGACA 2874 

AGACCGGCTT CCATCCGAGT ACGTGCTCGC TCGATGCGAT GTTTCGCTTG GTGGTCGAAT 2934 

GGGCAGGTAG CCGGATCAAG CGTATGCAGC CGCCGCATTG CATCAGCCAT GATGGATACT 2994 

TTCTCGGCAG GAGCAAGGTG AGATGACAGG AGATCCTGCC CCGGCACTTC GCCCAATAGC 3054 

AGCCAGTCCC TTCCCGCTTC AGTGACAACG TCGAGCACAG CTGCGCAAGG AACGCCCGTC 3114 

GTGGCCAGCC ACGATAGCCG CGCTGCCTCG TCCTGCAGTT CATTCAGGGC ACCGGACAGG 3174 

TCGGTCTTGA CAAAAAGAAC CGGGCGCCCC TGCGCTGACA GCCGGAACAC GGCGGCATCA 3234 
GAGCAGCCGA TTGTCTGTTG TGCCCAGTCA TAGCCGAATA GCCTCTCCAC CCAAGCGGCC -" 3294 

GGAGAACCTG CGTGCAATCC ATCTTGTTCA ATCATGCGAA ACGATCCTCA TCCTGTCTCT 3354 

TGATCAGATC TTGATCCCCT GCGCCATCAG ATCCTTGGCG GCAAGAAAGC CATCCAGTTT 3414 

ACTTTGCAGG GCTTCCCAAC CTTACCAGAG GGCGCCCCAG CTGGCAATTC C 3465 
(2) INFORMATION ZU SEQ ID NO: 10: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 401 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
1 5 10 15 

Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 

Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 

35 40 45_ 



Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 

65 70 75 80 
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Asp Lys Thr lie Val Trp Thr Arg Gly Thr Thr Glu Ser lie Asn Met 

85 90 95 

Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 110 

He Val Ser Val Ala Glu His His Ala Asn Leu val Pro Trp Leu Met 
115 120 125 

Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 
165 170 175 

Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 . 240 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 

245 250 255 

Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 

Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 

Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 

Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 
325 330 335 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly He Ala Leu 
340 345 350 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 
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Thr Gly Thr Leu Arg 
370 

Val Asp Ala Leu Val 
385 

Asp 



Ala Ser Phe Ala Pro Tyr 
375 

Asn Ala Val Asp Arg Ala 
390 395 



Asn Thr Lys Ser Asp 
380 

Leu Glu Leu Leu Val 

400 



(2) INFORMATION ZU SEQ ID NO: 11: 
(i) SEQUENZ CHARAKTERI STIKA : 

(A) LANGE: 3481 Basenpaare 

(B) ART: NukleinsSure 
<C) STRANG FORM : Einzel 
(D) TOPOLOGIE: ringformig 

(ii) ART DES MOLEKULS : DNS (genomisch) 

(iii) HYPOTHETISCH: NEIN 

(iii) ANTISENSE: NEIN 

(vii) UNMITTELBARE HERKUNFT: 
(B) CLON: pHS2bioS2 

fix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 279.. 1493 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 

GACGTCTAAG AAACCATTAT TATCATGACA TTAACCTATA AAAATAGGCG TATCACGAGG 60 

CCCTTTCGTC TTCACCTCGA GTCCCTATCA GTGATAGAGA TTGACATCCC TATCAGTGAT 120 

AG AG AT AC TG AGCACATCAG CAGGACGCAC TGACCGAATT CATTAAAGAG G AGAAAG GT A 180 

CCGGGCCCCC CCTCGAGGTC GACGGTATCG ATAAGCTTGA TATC GAATTC CTGCAGCCCG 240 

GGGGATCCCA TGGTACGCGT AAAG AG GAGA AATTAACT ATG AAA TTA CCG ATT 2 93 

Met Lys Leu Pro lie 
1 5 

TAT CTC GAC TAC TCC GCA ACC ACG CCG GTG GAC CCG CGT GTT GCC GAG 341 
Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp Pro Arg Val Ala Glu 

10 15 20 



AAA ATG ATG CAG TTT ATG ACG ATG GAC GGA ACC TTT GGT AAC CCG GCC 3 89 

Lys Met Met Gin Phe Met Thr Met Asp Gly Thr Phe Gly Asn Pro Ala 
25 30 35 
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TCC CGT TCT CAC CGT TTC GGC TGG CAG GCT GAA GAA GCG GTA GAT ATC 4 37 

Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu Glu Ala Val Asp lie 
40 45 50 

GCC CGT AAT CAG ATT GCC GAT CTG GTC GGC GCT GAT CCG CGT GAA ATC 4 85 

Ala Arg Asn Gin He Ala Asp Leu Val Gly Ala Asp Pro Arg Glu He 
55 60 65 

GTC TTT ACC TCT GGT GCA ACC GAA TCT GAC AAC CTG GCG ATC AAA GGT 533 
Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn Leu Ala He Lys Gly 
70 75 80 85 

GCA GCC AAC TTT TAT CAG AAA AAA GGC AAG CAC ATC ATC ACC AGC AAA 5 81 

Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His He lie Thr Ser Lys 

90 95 100 

ACC GAA CAC AAA GCG GTA CTG GAT ACC TGC CGT CAG CTG GAG CGC GAA 6 29 

Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg Gin Leu Glu Arg Glu 
105 HO H5 

GGT TTT GAA GTC ACC TAC CTG GCA CCG CAG CGT AAC GGC ATT ATC GAC 677 
Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg Asn Gly He He Asp 
120 125 130 

CTG AAA GAA CTT GAA GCA GCG ATG CGT GAC GAC ACC ATC CTC GTG TCC 725 
Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp Thr He Leu Val Ser 
135 140 145 

ATC ATG CAC GTA AAT AAC GAA ATC GGC GTG GTG CAG GAT ATC GCG GCT 773 
lie Met His Val Asn Asn Glu He Gly Val Val Gin Asp He Ala Ala 
150 155 160 165 

ATC GGC GAA ATG TGC CGT GCT CGT GGC ATT ATC TAT CAC GTT GAT GCA 821 
He Gly Glu Met Cys Arg Ala Arg Gly He He Tyr His Val Asp Ala 

170 175 180 

ACC CAG AGC GTG GGT AAA CTG CCT ATC GAC CTG AGC CAG TTG AAA GTT 869 
Thr Gin Ser Val Gly Lys Leu Pro He Asp Leu Ser Gin Leu Lys Val 
185 190 195 

GAC CTG ATG TCT TTC TCC GGT CAC AAA ATC TAT GGC CCG AAA GGT ATC 917 
Asp Leu Met Ser Phe Ser Gly His Lys lie Tyr Gly Pro Lys Gly He 
200 205 210 

GGT GCG CTG TAT GTA CGT CGT AAA CCG CGC GTA CGC ATC GAA GCG CAA 96 5 

Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val Arg He Glu Ala Gin 
215 220 225 

ATG CAC GGC GGC GGT CAC GAG CGC GGT ATG CGT TCC GGC ACT CTG CCT 1013 
Met His Gly Gly Gly His Glu Arg Gly Met Arg Ser Gly Thr Leu Pro 
230 235 240 245 
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GTT CAC CAG ATC GTC GGA ATG GGC GAG GCC TAT CGC ATC GCA AAA GAA 1061 
Val His Gin He Val Gly Met Gly Glu Ala Tyr Arg He Ala Lys Glu 

250 255 260 

GAG ATG GCG ACC GAG ATG GAA CGT CTG CGC GGC CTG CGT AAC CGT CTG 1109 
Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly Leu Arg Asn Arg Leu 
265 270 275 

TGG AAC GGC ATC AAA GAT ATC GAA GAA GTT TAC CTG AAC GGT GAC CTG 1157 
Trp Asn Gly He Lys Asp lie Glu Glu Val Tyr Leu Asn Gly Asp Leu 
280 285 290 

GAA CAC GGT GCG CCG AAC ATT CTC AAC GTC AGC TTC AAC TAC GTT GAA 1205 
Glu His Gly Ala Pro Asn He Leu Asn Val Ser Phe Asn Tyr Val Glu 
295 300 305 

GGT GAG TCG CTG ATT ATG GCG CTG AAA GAC CTC GCA GTT TCT TCA GGT 12 53 

Gly Glu Ser Leu lie Met Ala Leu Lys Asp Leu Ala Val Ser Ser Gly 
310 315 320 325 

TCC GCC TGT ACG TCA GCA AGC CTC GAA CCG TCC TAC GTG CTG CGC GCG 1301 
Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser Tyr Val Leu Arg Ala 
330 335 340 

CTG GGG CTG AAC GAC GAG CTG GCA CAT AGC TCT ATC CGT TTC TCT TTA 1349 
Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser He Arg Phe Ser Leu 
345 350 355 

GGT CGT TTT ACT ACT GAA GAA GAG ATC GAC TAC ACC ATC GAG TTA GTT 1397 
Gly Arg Phe Thr Thr Glu Glu Glu He Asp Tyr Thr He Glu Leu Val 
360 365 370 

CGT AAA TCC ATC GGT CGT CTG CGT GAC CTT TCT CCG CTG TGG GAA ATG 1445 
Arg Lys Ser He Gly Arg Leu Arg Asp Leu Ser Pro Leu Trp Glu Met 
375 380 385 

TAC AAG CAG GGC GTG GAT CTG AAC AGC ATC GAA TGG GCT CAT CAT TAAACGCGTG 1500 
Tyr Lys" Gin "Gly Val Asp Leu" Asn Ser lie Glu Trp "Ala His His 
390 395 400 405 

CTAGAGGCAT CAAATAAAAC GAAAGGCTCA GTCGAAAGAC TGGGCCTTTC GTTTTATCTG 1560 

TTGTTTGTCG GTGAACGCTC TCCTGAGTAG GACAAATCCG CCGCCCTAGA CCTAGGGGAT 1620 

ATATTCCGCT TCCTCGCTCA CTGACTCGCT ACGCTCGGTC GTTCGACTGC GGCGAGCGGA 1680 

"XATGGCTTAC GAACGGGGCG~GAGATTTCCT"GGAAGATGCC — AGGAAGATAC~TTAACAGGGA 1*74 0 

AGTGAGAGGG CCGCGGCAAA GCCGTTTTTC CATAGGCTCC GCCCCCCTGA CAAGCATCAC 1800 

GAAATC TG AC GCTCAAATCA GTGGTGGCGA AACCCGACAG GAC T AT AAA G ATACCAGGCG 1860 

TTTCCCCCTG GCGGCTCCCT CGTGCGCTCT CCTGTTCCTG CCTTTCGGTT TACCGGTGTC 1920 
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<i) SEQUENZ CHARAKTE RI ST I KA : 

(A) LANGE : 404 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 

Met Lys Leu Pro lie Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp 
1 5 10 15 

Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp Gly Thr 
20 25 30 

Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu 
35 40 45 

Glu Ala Val Asp lie Ala Arg Asn Gin lie Ala Asp Leu Val Gly Ala 
50 55 60 

Asp Pro Arg Glu lie Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn 
65 70 75 80 

Leu Ala lie Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His 

85 90 95 

lie lie Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg 
100 105 110 

Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg 
115 120 125 

Asn Gly lie lie Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp 
130 135 140 

Thr lie Leu Val Ser lie Met His val Asn Asn Glu lie Gly Val Val 
145 150 155 160 

Gin Asp lie Ala Ala lie Gly Glu Met Cys Arg Ala Arg Gly lie lie 

165 170 175 

Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro lie Asp Leu 
180 185 190 

Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys lie Tyr 
195 200 205 

Gly Pro Lys Gly lie Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val 
210 215 220 

Arg lie Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly Met Arg 
225 230 235 240 
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Ser Gly Thr Leu 



Arg lie Ala Lys 
260 

Leu Arg Asn Arg 
275 

Leu Asn Gly Asp 
290 

Phe Asn Tyr Val 
305 

Ala Val Ser Ser 



Tyr Val Leu Arg 
340 

lie Arg Phe Ser 
355 

Thr lie Glu Leu 
370 

Pro Leu Trp Glu 
385 

Trp Ala His His 



Pro Val His Gin 
245 

Glu Glu Met Ala 



Leu Trp Asn Gly 
280 

Leu Glu His Gly 
295 

Glu Gly Glu Ser 
310 

Gly Ser Ala Cys 
325 

Ala Leu Gly Leu 



Leu Gly Arg Phe 
360 

Val Arg Lys Ser 
375 

Met Tyr Lys Gin 
390 



lie Val Gly Met 
250 

Thr Glu Met Glu 
265 

lie Lys Asp lie 



Ala Pro Asn lie 
300 

Leu lie Met Ala 
315 

Thr Ser Ala Ser 
330 

Asn Asp Glu Leu 
345 

Thr Thr Glu Glu 



lie Gly Arg Leu 
380 

Gly Val Asp Leu 
395 



Gly Glu Ala Tyr 
255 

Arg Leu Arg Gly 
270 

Glu Glu val Tyr 
285 

Leu Asn Val Ser 



Leu Lys Asp Leu 
320 

Leu Glu Pro Ser 
335 

Ala His Ser Ser 
350 

Glu lie Asp Tyr 
365 

Arg Asp Leu Ser 



Asn Ser lie Glu 
400 
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